最新版tp钱包官方下载|sklearn中文教程官网

作者: 最新版tp钱包官方下载
2024-03-16 07:44:04

scikit-learn中文社区

scikit-learn中文社区

安装

用户指南

API

案例

更多

入门

教程

更新日志

词汇表

常见问题

交流群

scikit-learn

Machine Learning in Python

入门

0.23版本的发布要点

GitHub

交流微信群二维码

简单有效的工具进行预测数据分析

每个人都可以访问,并且可以在各种情况下重用

基于NumPy,SciPy和matplotlib构建

开源,可商业使用-BSD许可证

分类

标识对象所属的类别。

应用范围: 垃圾邮件检测,图像识别。

算法:

SVM

最近邻

随机森林

更多...

Examples

回归

预测与对象关联的连续值属性。

应用范围: 药物反应,股票价格。

算法:

SVR

最近邻

随机森林

更多...

Examples

聚类

自动将相似对象归为一组。

应用: 客户细分,分组实验成果。

算法:

K-均值

谱聚类

MeanShift

更多...

Examples

降维

减少要考虑的随机变量的数量。

应用: 可视化,提高效率。

算法:

K-均值

特征选择

非负矩阵分解

更多...

Examples

模型选择

比较,验证和选择参数和模型。

应用: 通过参数调整改进精度。

算法:

网格搜索

交叉验证

指标

更多...

Examples

预处理

特征提取和归一化。

应用程序: 转换输入数据,例如文本,以供机器学习算法使用。

算法:

预处理

特征提取

更多...

Examples

新闻

正在开发中的版本:

更新日志 (Changelog)

2020年8月. scikit-learn 0.23.2 可供下载 (更新日志).

2020年5月. scikit-learn 0.23.1 可供下载 (更新日志).

2020年5月. scikit-learn 0.23.0 可供下载 (更新日志).

Scikit-learn from 0.23 要求 Python 3.6 或更高版本.

2020年3月. scikit-learn 0.22.2 可供下载 (更新日志).

2020年1月. scikit-learn 0.22.1 可供下载 (更新日志).

2019年12月. scikit-learn 0.22 可供下载 (更新日志 and 发布亮点).

Scikit-learn from 0.21 要求 Python 3.5 或更高版本.

2019年7月. scikit-learn 0.21.3 (Changelog) and 0.20.4 (更新日志) 可供下载.

2019年5月. scikit-learn 0.21.0 to 0.21.2 可供下载 (更新日志).

关于

关于我们: CDA数据科学研究院

赞助支持: CDA考试认证中心

客服电话: +86 4000-51-9191

邮箱: service@cda.cn

关注我们

"Scikit-learn 中文文档由CDA数据科学研究院翻译,扫码关注获取更多信息。"

Copyright © 2015-2020, CDA数据科学研究院 版权所有 京ICP备11001960号-13

now loading...

scikit-learn (sklearn) 官方文档中文版 - sklearn

scikit-learn (sklearn) 官方文档中文版 - sklearn

sklearn

sklearn 中文文档

安装 scikit-learn

1. 监督学习

1.0 监督学习

1.1. 广义线性模型

1.2. 线性和二次判别分析

1.3. 内核岭回归

1.4. 支持向量机

1.5. 随机梯度下降

1.6. 最近邻

1.7. 高斯过程

1.8. 交叉分解

1.9. 朴素贝叶斯

1.10. 决策树

1.11. 集成方法

1.12. 多类和多标签算法

1.13. 特征选择

1.14. 半监督学习

1.15. 等式回归

1.16. 概率校准

1.17. 神经网络模型(有监督)

2. 无监督学习

2.0 无监督学习

2.1. 高斯混合模型

2.2. 流形学习

2.3. 聚类

2.4. 双聚类

2.5. 分解成分中的信号(矩阵分解问题)

2.6. 协方差估计

2.7. 新奇和异常值检测

2.8. 密度估计

2.9. 神经网络模型(无监督)

3. 模型选择和评估

3.0 模型选择和评估

3.1. 交叉验证:评估估算器的表现

3.2. 调整估计器的超参数

3.3. 模型评估: 量化预测的质量

3.4. 模型持久化

3.5. 验证曲线: 绘制分数以评估模型

4. 检验

4.0 检验

4.1. 部分依赖图

5. 数据集转换

5.0 数据集转换

5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器

5.2. 特征提取

5.3 预处理数据

5.4 缺失值插补

5.5. 无监督降维

5.6. 随机投影

5.7. 内核近似

5.8. 成对的矩阵, 类别和核函数

5.9. 预测目标

6. 数据集加载工具

6.0 数据集加载工具

6.1. 通用数据集 API

6.2. 玩具数据集

6.3 真实世界中的数据集

6.4. 样本生成器

6.5. 加载其他数据集

7. 使用scikit-learn计算

7.0 使用scikit-learn计算

7.1. 大规模计算的策略: 更大量的数据

7.2. 计算性能

7.3. 并行性、资源管理和配置

教程

使用 scikit-learn 介绍机器学习

关于科学数据处理的统计学习教程

关于科学数据处理的统计学习教程

机器学习: scikit-learn 中的设置以及预估对象

监督学习:从高维观察预测输出变量

模型选择:选择估计量及其参数

无监督学习: 寻求数据表示

把它们放在一起

寻求帮助

处理文本数据

选择正确的评估器(estimator.md

外部资源,视频和谈话

API 参考

常见问题

时光轴

sklearn

Docs »

scikit-learn (sklearn) 官方文档中文版

scikit-learn (sklearn) 官方文档中文版

scikit-learn 是基于 Python 语言的机器学习工具

简单高效的数据挖掘和数据分析工具

可供大家在各种环境中重复使用

建立在 NumPy ,SciPy 和 matplotlib 上

开源,可商业使用 - BSD许可证

维护地址

Github

在线阅读

EPUB 格式

目录

安装 scikit-learn

用户指南

1. 监督学习

1.1. 广义线性模型

1.2. 线性和二次判别分析

1.3. 内核岭回归

1.4. 支持向量机

1.5. 随机梯度下降

1.6. 最近邻

1.7. 高斯过程

1.8. 交叉分解

1.9. 朴素贝叶斯

1.10. 决策树

1.11. 集成方法

1.12. 多类和多标签算法

1.13. 特征选择

1.14. 半监督学习

1.15. 等式回归

1.16. 概率校准

1.17. 神经网络模型(有监督)

2. 无监督学习

2.1. 高斯混合模型

2.2. 流形学习

2.3. 聚类

2.4. 双聚类

2.5. 分解成分中的信号(矩阵分解问题)

2.6. 协方差估计

2.7. 新奇和异常值检测

2.8. 密度估计

2.9. 神经网络模型(无监督)

3. 模型选择和评估

3.1. 交叉验证:评估估算器的表现

3.2. 调整估计器的超参数

3.3. 模型评估: 量化预测的质量

3.4. 模型持久化

3.5. 验证曲线: 绘制分数以评估模型

4. 检验

4.1. 部分依赖图

5. 数据集转换

5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器

5.2. 特征提取

5.3 预处理数据

5.4 缺失值插补

5.5. 无监督降维

5.6. 随机投影

5.7. 内核近似

5.8. 成对的矩阵, 类别和核函数

5.9. 预测目标 (y) 的转换

6. 数据集加载工具

6.1. 通用数据集 API

6.2. 玩具数据集

6.3 真实世界中的数据集

6.4. 样本生成器

6.5. 加载其他数据集

7. 使用scikit-learn计算

7.1. 大规模计算的策略: 更大量的数据

7.2. 计算性能

7.3. 并行性、资源管理和配置

教程

使用 scikit-learn 介绍机器学习

关于科学数据处理的统计学习教程

机器学习: scikit-learn 中的设置以及预估对象

监督学习:从高维观察预测输出变量

模型选择:选择估计量及其参数

无监督学习: 寻求数据表示

把它们放在一起

寻求帮助

处理文本数据

选择正确的评估器(estimator.md)

外部资源,视频和谈话

API 参考

常见问题

时光轴

贡献指南

项目当前处于校对阶段,请查看贡献指南,并在整体进度中领取任务。

请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自维基百科)

项目负责人

格式: GitHub + QQ

@mahaoyang:992635910

@loopyme:3322728009

飞龙:562826179

片刻:529815144

-- 负责人要求: (欢迎一起为 sklearn 中文版本 做贡献)

热爱开源,喜欢装逼

长期使用 sklearn(至少0.5年) + 提交Pull Requests>=3

能够有时间及时优化页面 bug 和用户 issues

试用期: 2个月

欢迎联系: 片刻 529815144

项目协议

以各项目协议为准。

ApacheCN 账号下没有协议的项目,一律视为 CC BY-NC-SA 4.0。

建议反馈

在我们的 apachecn/pytorch-doc-zh github 上提 issue.

发邮件到 Email: apachecn@163.com.

在我们的 QQ群-搜索: 交流方式 中联系群主/管理员即可.

赞助我们

sklearn PythonOK 协议:CC BY-NC-SA 4.0

Built with MkDocs using a theme provided by Read the Docs.

Scikit-learn官网

Scikit-learn官网

访问Scikit-learn官网

Scikit-learn(以前称为scikits.learn,也称为sklearn)是针对Python 编程语言的免费软件机器学习库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k均值和DBSCAN,并且旨在与Python数值科学库NumPy和SciPy联合使用。>> Scikit-learn注册地址 <<

首页

注册教程

使用教程

市场应用

产品价格

联系方式

1 / 3

2 / 3

3 / 3

❮ ❯

上线时间

2023年

总部地址

OpenAI

所属公司

OpenAI

产品内容

对话聊天

免费版本

支持

产品价格

每月12美元

支付方式

信用卡

API

支持

官网地址

https://scikit-learn.org

Scikit-learn简介

Scikit-learn项目始于scikits.learn,这是David Cournapeau的Google Summer of Code项目。它的名称源于它是" SciKit"(SciPy工具包)的概念,它是SciPy的独立开发和分布式第三方扩展。原始代码库后来被其他开发人员重写。2010年费边Pedregosa,盖尔Varoquaux,亚历山大Gramfort和Vincent米歇尔,全部由法国国家信息与自动化研究所的罗屈昂库尔,法国,把该项目的领导和做出的首次公开发行在二月一日2010在各种scikits中,scikit-learn以及scikit-image在2012年11月被描述为"维护良好且受欢迎" 。Scikit-learn是GitHub上最受欢迎的机器学习库之一。

实施

Scikit-learn主要是用Python编写的,并且广泛使用numpy进行高性能的线性代数和数组运算。此外,用Cython编写了一些核心算法来提高性能。支持向量机由围绕LIBSVM的Cython包装器实现 ; 逻辑回归和线性支持向量机的相似包装围绕LIBLINEAR。在这种情况下,可能无法使用Python扩展这些方法。

Scikit-learn与许多其他Python库很好地集成在一起,例如matplotlib和plotly用于绘图,numpy用于数组矢量化,pandas数据帧,scipy等。

中文社区

Scikit-learn中文社区,由CDA全国教研团队承接,通过一年多的Scikit-learn文档的翻译和认真校对,从用户指南到API 、再到案例,翻译字数达一百余万字,相较与网络上流传的其他机器翻译的Scikit-learn中文资料,CDA Scikit-learn中文社区的翻译是最新的官方版本,并且内容更加全面,格式更加规范,翻译更加专业精准,努力为机器学习爱好者提供更便捷的学习途径。

版本历史

Scikit-learn最初由David Cournapeau 于2007年在Google的夏季代码项目中开发。后来Matthieu Brucher加入该项目,并开始将其用作论文工作的一部分。2010年,法国计算机科学与自动化研究所INRIA参与其中,并于2010年1月下旬发布了第一个公开版本(v0.1 beta)。

2022年12月 - scikit-learn1.2.0

2022年5月 - scikit-learn1.1.0

2021年9月 - scikit-learn1.0

2020年12月 - scikit-learn0.24.0

2020年5月 - scikit-learn0.23.0

2019年12月 - scikit-learn 0.22.0

2019年5月 - scikit-learn 0.21.0

2018年9月 - scikit-learn 0.20.0

2017年7月 - scikit-learn 0.19.0

2016年9月 - scikit-learn 0.18.0

2015年11月 - scikit-learn 0.17.0

2015年3月 - scikit-learn0.16.0

2014年7月 - scikit-learn 0.15.0

2013年8月 - scikit-learn 0.14

Copyright @ 2023 www.scikit-china.com All Rights Reserved.

GitHub - Apache-CN/scikit-learn-doc-zh: scikit-learn(sklearn) 官方文档中文版

GitHub - Apache-CN/scikit-learn-doc-zh: scikit-learn(sklearn) 官方文档中文版

Skip to content

Toggle navigation

Sign in

Product

Actions

Automate any workflow

Packages

Host and manage packages

Security

Find and fix vulnerabilities

Codespaces

Instant dev environments

Copilot

Write better code with AI

Code review

Manage code changes

Issues

Plan and track work

Discussions

Collaborate outside of code

Explore

All features

Documentation

GitHub Skills

Blog

Solutions

For

Enterprise

Teams

Startups

Education

By Solution

CI/CD & Automation

DevOps

DevSecOps

Resources

Learning Pathways

White papers, Ebooks, Webinars

Customer Stories

Partners

Open Source

GitHub Sponsors

Fund open source developers

The ReadME Project

GitHub community articles

Repositories

Topics

Trending

Collections

Pricing

Search or jump to...

Search code, repositories, users, issues, pull requests...

Search

Clear

Search syntax tips

Provide feedback

We read every piece of feedback, and take your input very seriously.

Include my email address so I can be contacted

Cancel

Submit feedback

Saved searches

Use saved searches to filter your results more quickly

Name

Query

To see all available qualifiers, see our documentation.

Cancel

Create saved search

Sign in

Sign up

You signed in with another tab or window. Reload to refresh your session.

You signed out in another tab or window. Reload to refresh your session.

You switched accounts on another tab or window. Reload to refresh your session.

Dismiss alert

Apache-CN

/

scikit-learn-doc-zh

Public

forked from apachecn/sklearn-doc-zh

Notifications

Fork

0

Star

0

scikit-learn(sklearn) 官方文档中文版

sklearn.apachecn.org

License

GPL-3.0 license

0

stars

1.5k

forks

Branches

Tags

Activity

Star

Notifications

Code

Pull requests

0

Actions

Projects

0

Security

Insights

Additional navigation options

Code

Pull requests

Actions

Projects

Security

Insights

Apache-CN/scikit-learn-doc-zh

This commit does not belong to any branch on this repository, and may belong to a fork outside of the repository.

 0.19.XBranchesTagsGo to fileCode  Folders and filesNameNameLast commit messageLast commit dateLatest commit History762 Commitsdocdoc  examplesexamples  flowchartflowchart  helphelp  LICENSELICENSE  README.mdREADME.md  View all filesRepository files navigationREADMEGPL-3.0 licensescikit-learn(sklearn) 官方文档中文版

scikit-learn 是基于 Python 语言的机器学习工具。

简单高效的数据挖掘和数据分析工具

可供大家在各种环境中重复使用

建立在 NumPy ,SciPy 和 matplotlib 上

开源,可商业使用 - BSD许可证

官网地址: scikit-learn(sklearn): http://scikit-learn.org

中文文档: ApacheCN - scikit-learn(sklearn): http://sklearn.apachecn.org

维护地址

github: https://github.com/apachecn/scikit-learn-doc-zh/

ApacheCN: http://sklearn.apachecn.org/

正在翻译

scikit-learn(sklearn) 0.19

历史版本

scikit-learn(sklearn) 0.18 官方文档中文版: http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030181

参与翻译 & 发现错误

1. 在 github 上 fork 该 repository.

2. 翻译 doc/zh/modules 和 doc/zh/tutorial 下面的 rst 文件即可, 例如, tutorial.rst.

3. 然后, 在你的 github 发起 New pull request 请求.

4. 工具使用, 可参考下面的内容.

工具使用(针对新手)

工欲善其事, 必先利其器 ...

工具随意, 能达到效果就好.

我这里使用的是 VSCode 编辑器.

简易的使用指南请参阅: VSCode Windows 平台入门使用指南, 介绍了 VSCode 与 github 一起搭配的简易使用的方法.

如果要将 VSCode 的 Markdown 预览风格切换为 github 的风格,请参阅: VSCode 修改 markdown 的预览风格为 github 的风格.

注意注意注意:

为了尽量正规化各顶级项目的翻译,更便于以后的迭代更新,我们在 scikit-learn 文档翻译中使用了 Git 的分支,具体应用方法请参阅: 使用 Git 分支进行迭代翻译.

角色分配

目前有如下可分配的角色:

翻译: 负责文章内容的翻译.

校验: 负责文章内容的校验, 比如格式, 正确度之类的.

负责人: 负责整个 Projcet, 不至于让该 Project 成为垃圾项目, 需要在 sklearn 方面经验稍微丰富点.

有兴趣参与的朋友, 可以看看最后的联系方式.

负责人

@chenyyx(Joy yx)

贡献者

贡献者可自行编辑如下内容(排名不分先后).

0.19.0

翻译者(人人皆大佬~):

@wangyangting(那伊抹微笑)

@jiangzhonglian(片刻)

@chenyyx(Joy yx)

@survivingME(Trembleguy)

@mtobeiyf(Fing)

@Leon-Jin(Leon晋)

@X1aoFang(X1aoFang)

@loverollcat(loverollcat)

@helloheshee(helloheshee)

@SkyDreamStart(SkyDreamStart)

@HazekiahWon(Hazekiah Wang)

@201419(tree)

@busesese(wenyi)

@chrzc(changzhicheng)

@Zoctan(Zoctan)

@JanzenLiu(Janzen_Liu)

@charleschou520(charleschou520)

@zhangqiking(BigBird)

@mikechengwei(Mike)

@wodekwan(wodekwan)

@sehriff(sehriff)

@Kdotm(kngines)

@patientman(YuanMingLiu)

@DamonDay(DamonDay)

@cszhangbo(cszhangbo)

@XingxGit(XingxGit)

@KrokYin(KrokYin)

@yw10(Andrew Yao)

@GlassyWu(glassy)

@PrivateRookie(PrivateRookie)

@linweijiang(linweijiang)

@jiaqiangbandongg(jiaqiangbandongg)

@supportingvector(supportingvector)

@stealthsMrs(stealthsMrs)

@lhwlhw90(lhwlhw90)

@sheepmen(羊三)

@guohao916(guohao_dm)

@Daemon-ser(csu_hgq)

@wangxiancai(BWM-蜜蜂)

@夜神月(夜神月)

@liyangbit(Lemon)

@XuJianzhi(XuJianzhi)

校验者(人人皆大佬~)(现在还不齐全,贡献者大佬们可随意修改)

@FontTian(FontTian)

@XuJianzhi(XuJianzhi)

@caopeirui(Veyron C)

@HelloSilicat(Jialiang Pei)

@AnybodyHome(loop)

@pan8664716(pan8664716)

@xrj(xrj)

@qvduoduo1997(qvduoduo1997)

@marsjhao(Zhang Junhao)

@tiantian1412(tiantian1412)

@sheepmen(羊三)

@wangyangting(那伊抹微笑)

@jiangzhonglian(片刻)

@chenyyx(Joy yx)

@mikechengwei(Mike)

@wangxiancai(BWM-蜜蜂)

@busesese(wenyi)

@GlassyWu(glassy)

@wodekwan(wodekwan)

@gbyy422990(Bin GAO)

@charleschou520(charleschou520)

@DataMonk2017(Jeremy Zheng)

@Lixu518(Mysry)

@linxiamen(YUNCHUAN LIN)

@llcing(Mayouji)

@KyrieHee(HeYun)

@ziepenn(ziepenn)

@FAN0521(FAN0521)

@Daemon-ser(csu_hgq)

@shaoyy147(Y.Shao)

@Kdotm(kngines)

@chrzc(changzhicheng)

@ywujudy(ywujudy)

@污剑客(污剑客)

@爱吹牛逼的小明(爱吹牛逼的小明)

@JanzenLiu(Janzen_Liu)

@Ecauchy(Ecauchy)

0.18

请参阅: http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030181

联系方式

有任何建议反馈, 或想参与文档翻译, 麻烦联系下面的企鹅:

企鹅: 1042658081(那伊抹微笑), 190442212(小瑶), 529815144(片刻)

其它中文文档

TensorFlow R1.2 中文文档

sklearn 0.18 中文文档

Spark 2.2.0 中文文档

Spark 2.0.2 中文文档

Kudu 1.4.0 中文文档

Zeppelin 0.7.2 中文文档

Elasticsearch 5.4 中文文档

Kibana 5.2 中文文档

Storm 1.1.0 中文文档

About

scikit-learn(sklearn) 官方文档中文版

sklearn.apachecn.org

Resources

Readme

License

GPL-3.0 license

Activity

Custom properties

Stars

0

stars

Watchers

2

watching

Forks

0

forks

Report repository

Releases

No releases published

Packages

0

No packages published

Languages

Python

100.0%

Footer

© 2024 GitHub, Inc.

Footer navigation

Terms

Privacy

Security

Status

Docs

Contact

Manage cookies

Do not share my personal information

You can’t perform that action at this time.

保姆级教程:机器学习神器Scikit-Learn使用方法指南! - 知乎

保姆级教程:机器学习神器Scikit-Learn使用方法指南! - 知乎首发于Python与数据挖掘切换模式写文章登录/注册保姆级教程:机器学习神器Scikit-Learn使用方法指南!Python与数据挖掘​蚂蚁科技集团股份有限公司 员工作者尤而小屋,来自:Scikit-Learn教程欢迎关注 @Python与数据挖掘 ,专注 Python、数据分析、数据挖掘、好玩工具!我们知道 Scikit-learn 是一个非常知名的Python机器学习库,它广泛地用于统计分析和机器学习建模等数据科学领域。它具有如下特点:建模无敌:用户通过scikit-learn能够实现各种监督和非监督学习的模型功能多样:同时使用sklearn还能够进行数据的预处理、特征工程、数据集切分、模型评估等工作数据丰富:内置丰富的数据集,比如:泰坦尼克、鸢尾花等,数据不再愁啦今天本篇文章通过简明快要的方式来介绍scikit-learn的使用,喜欢记得点赞、收藏、关注。内置数据集使用数据集切分数据归一化和标准化类型编码建模6步曲交流群群内高手如云,想要技术交流、资料获取的同学,可以直接加微信号:dkl88191。加的时候备注一下:研究方向+学校/公司+知乎,即可。然后我拉你进群。一、Scikit-learn使用神图 下面这张图是官网提供的,从样本量的大小开始,分为回归、分类、聚类、数据降维共4个方面总结了scikit-learn的使用:https://scikit-learn.org/stable/tutorial/machine_learning_map/index.html二、安装 关于安装scikit-learn,建议通过使用anaconda来进行安装,不用担心各种配置和环境问题。当然也可以直接pip来安装:pip install scikit-learn三、数据集生成 sklearn内置了一些优秀的数据集,比如:Iris数据、房价数据、泰坦尼克数据等。import pandas as pd

import numpy as np

import sklearn

from sklearn import datasets # 导入数据集分类数据-iris数据# iris数据

iris = datasets.load_iris()

type(iris)

sklearn.utils.Bunchiris数据到底是什么样子?每个内置的数据都存在很多的信息可以将上面的数据生成我们想看到的DataFrame,还可以添加因变量:回归数据-波士顿房价我们重点关注的属性:datatarget、target_namesfeature_namesfilename同样可以生成DataFrame:三种方式生成数据方式1#调用模块

from sklearn.datasets import load_iris

data = load_iris()

#导入数据和标签

data_X = data.data

data_y = data.target 方式2from sklearn import datasets

loaded_data = datasets.load_iris() # 导入数据集的属性

#导入样本数据

data_X = loaded_data.data

# 导入标签

data_y = loaded_data.target方式3# 直接返回

data_X, data_y = load_iris(return_X_y=True)数据集使用汇总from sklearn import datasets # 导入库

boston = datasets.load_boston() # 导入波士顿房价数据

print(boston.keys()) # 查看键(属性) ['data','target','feature_names','DESCR', 'filename']

print(boston.data.shape,boston.target.shape) # 查看数据的形状

print(boston.feature_names) # 查看有哪些特征

print(boston.DESCR) # described 数据集描述信息

print(boston.filename) # 文件路径 四、数据切分 # 导入模块

from sklearn.model_selection import train_test_split

# 划分为训练集和测试集数据

X_train, X_test, y_train, y_test = train_test_split(

data_X,

data_y,

test_size=0.2,

random_state=111

)

# 150*0.8=120

len(X_train)五、数据标准化和归一化 from sklearn.preprocessing import StandardScaler # 标准化

from sklearn.preprocessing import MinMaxScaler # 归一化

# 标准化

ss = StandardScaler()

X_scaled = ss.fit_transform(X_train) # 传入待标准化的数据

# 归一化

mm = MinMaxScaler()

X_scaled = mm.fit_transform(X_train)六、类型编码 来自官网案例:https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html对数字编码对字符串编码七、建模案例 导入模块from sklearn.neighbors import KNeighborsClassifier, NeighborhoodComponentsAnalysis # 模型

from sklearn.datasets import load_iris # 导入数据

from sklearn.model_selection import train_test_split # 切分数据

from sklearn.model_selection import GridSearchCV # 网格搜索

from sklearn.pipeline import Pipeline # 流水线管道操作

from sklearn.metrics import accuracy_score # 得分验证模型实例化# 模型实例化

knn = KNeighborsClassifier(n_neighbors=5)训练模型knn.fit(X_train, y_train)

KNeighborsClassifier()测试集预测y_pred = knn.predict(X_test)

y_pred # 基于模型的预测值

array([0, 0, 2, 2, 1, 0, 0, 2, 2, 1, 2, 0, 1, 2, 2, 0, 2, 1, 0, 2, 1, 2,

1, 1, 2, 0, 0, 2, 0, 2])得分验证模型得分验证的两种方式:knn.score(X_test,y_test)

0.9333333333333333

accuracy_score(y_pred,y_test)

0.9333333333333333网格搜索如何搜索参数from sklearn.model_selection import GridSearchCV

# 搜索的参数

knn_paras = {"n_neighbors":[1,3,5,7]}

# 默认的模型

knn_grid = KNeighborsClassifier()

# 网格搜索的实例化对象

grid_search = GridSearchCV(

knn_grid,

knn_paras,

cv=10 # 10折交叉验证

)

grid_search.fit(X_train, y_train)

GridSearchCV(cv=10, estimator=KNeighborsClassifier(),

param_grid={'n_neighbors': [1, 3, 5, 7]})

# 通过搜索找到的最好参数值

grid_search.best_estimator_

KNeighborsClassifier(n_neighbors=7)

grid_search.best_params_Out[42]:{'n_neighbors': 7}

grid_search.best_score_

0.975基于搜索结果建模knn1 = KNeighborsClassifier(n_neighbors=7)

knn1.fit(X_train, y_train)

KNeighborsClassifier(n_neighbors=7)通过下面的结果可以看到:网格搜索之后的建模效果是优于未使用网格搜索的模型:y_pred_1 = knn1.predict(X_test)

knn1.score(X_test,y_test)

1.0

accuracy_score(y_pred_1,y_test)

1.0文章推荐2022年,这10 个 Github 热门且实用的 Python库值得收藏!轻松解决时序异常检测问题,pyfbad 这次火了!深度盘点 :15种最常用的数据分析模型,赶紧收藏心得总结:一名优秀的数据分析专家的能力模型实践分享:如何搭建数据指标体系?够强大!Python 这款可视化大屏不足百行代码!太漂亮了 ! 输出好看的表格,就用这个 Python 库!摒弃这18个 Python 坏习惯,让你的代码好用到起飞!深度盘点:8000字详细介绍 Python 中的 7 种交叉验证方法效率倍增!5 个提高生产力的 Jupyter notebook插件!20+时序模型!GluonTS:一个专门为时间序列建模而设计的工具包!只需三五行代码即可产出完美数据分析报告,这四大 AutoEDA 工具包真的太棒了!微软出品!FLAML:一款可以自动化机器学习过程的神器!整理不易,有所收获,点个赞和爱心❤️,更多精彩欢迎关注编辑于 2022-02-13 07:58人工智能机器学习Python​赞同 98​​2 条评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录Python与数据挖掘内容首发WX订阅号,专栏与WX订阅号重名:Python学习与数据挖掘,内容专注于Python、数据分析、数据挖掘,人工智能、

教程 - sklearn

教程 - sklearn

sklearn

sklearn 中文文档

安装 scikit-learn

1. 监督学习

1.0 监督学习

1.1. 广义线性模型

1.2. 线性和二次判别分析

1.3. 内核岭回归

1.4. 支持向量机

1.5. 随机梯度下降

1.6. 最近邻

1.7. 高斯过程

1.8. 交叉分解

1.9. 朴素贝叶斯

1.10. 决策树

1.11. 集成方法

1.12. 多类和多标签算法

1.13. 特征选择

1.14. 半监督学习

1.15. 等式回归

1.16. 概率校准

1.17. 神经网络模型(有监督)

2. 无监督学习

2.0 无监督学习

2.1. 高斯混合模型

2.2. 流形学习

2.3. 聚类

2.4. 双聚类

2.5. 分解成分中的信号(矩阵分解问题)

2.6. 协方差估计

2.7. 新奇和异常值检测

2.8. 密度估计

2.9. 神经网络模型(无监督)

3. 模型选择和评估

3.0 模型选择和评估

3.1. 交叉验证:评估估算器的表现

3.2. 调整估计器的超参数

3.3. 模型评估: 量化预测的质量

3.4. 模型持久化

3.5. 验证曲线: 绘制分数以评估模型

4. 检验

4.0 检验

4.1. 部分依赖图

5. 数据集转换

5.0 数据集转换

5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器

5.2. 特征提取

5.3 预处理数据

5.4 缺失值插补

5.5. 无监督降维

5.6. 随机投影

5.7. 内核近似

5.8. 成对的矩阵, 类别和核函数

5.9. 预测目标

6. 数据集加载工具

6.0 数据集加载工具

6.1. 通用数据集 API

6.2. 玩具数据集

6.3 真实世界中的数据集

6.4. 样本生成器

6.5. 加载其他数据集

7. 使用scikit-learn计算

7.0 使用scikit-learn计算

7.1. 大规模计算的策略: 更大量的数据

7.2. 计算性能

7.3. 并行性、资源管理和配置

教程

使用 scikit-learn 介绍机器学习

关于科学数据处理的统计学习教程

关于科学数据处理的统计学习教程

机器学习: scikit-learn 中的设置以及预估对象

监督学习:从高维观察预测输出变量

模型选择:选择估计量及其参数

无监督学习: 寻求数据表示

把它们放在一起

寻求帮助

处理文本数据

选择正确的评估器(estimator.md

外部资源,视频和谈话

API 参考

常见问题

时光轴

sklearn

Docs »

教程

scikit-learn 教程 0.21.x

使用 scikit-learn 介绍机器学习

机器学习:问题设置

加载示例数据集

学习和预测

模型持久化

规定

关于科学数据处理的统计学习教程

机器学习: scikit-learn 中的设置以及预估对象

数据集

预估对象

监督学习:从高维观察预测输出变量

最近邻和维度惩罚

线性模型:从回归到稀疏

支持向量机(SVMs)

模型选择:选择估计量及其参数

分数和交叉验证分数

交叉验证生成器

网格搜索和交叉验证估计量

无监督学习: 寻求数据表示

聚类: 对样本数据进行分组

分解: 将一个信号转换成多个成份并且加载

把它们放在一起

模型管道化

用特征面进行人脸识别

开放性问题: 股票市场结构

寻求帮助

项目邮件列表

机器学习从业者的 Q&A 社区

处理文本数据

教程设置

加载这 20 个新闻组的数据集

从文本文件中提取特征

训练分类器

构建-pipeline(管道)

在测试集上的性能评估

使用网格搜索进行调参

练习

快速链接

选择正确的评估器(estimator.md)

外部资源,视频和谈话

Next

Previous

sklearn PythonOK 协议:CC BY-NC-SA 4.0

Built with MkDocs using a theme provided by Read the Docs.

« Previous

Next »

你需要的Scikit-learn中文文档:步入机器学习的完美实践教程 - 知乎

你需要的Scikit-learn中文文档:步入机器学习的完美实践教程 - 知乎首发于机器之心切换模式写文章登录/注册你需要的Scikit-learn中文文档:步入机器学习的完美实践教程机器之心​数学等 2 个话题下的优秀答主Scikit-learn 中文文档已经由 ApacheCN 完成校对,这对于国内机器学习用户有非常大的帮助。该文档自 2017 年 11 月初步完成校对,目前很多细节都已经得到完善。该中文文档包含了分类、回归、聚类和降维等经典机器学习任务,并提供了完整的使用教程与 API 注释。入门读者也可以借此文档与教程从实践出发进入数据科学与机器学习的领域。中文文档地址:http://sklearn.apachecn.orgScikit-learn 是基于 Python 的开源机器学习库,它基于 NumPy 和 SciPy 等科学计算库,并支持支持向量机、随即森林、梯度提升树、K 均值聚类等学习算法。Scikit-learn 目前主要由社区成员自发进行维护,且专注于构建机器学习领域内经广泛验证的成熟算法。Scikit-learn 项目最早为数据科学家 David Cournapeau 于 2007 年发起的 scikits.learn 项目,且 Scikit 的名字可视为 SciPy Toolkit,即 SciPy 的第三方扩展。Scikit-learn 大部分都是由 Python 构建,但还是有很多核心算法是由 Cython 完成而实现更好的效果,例如支持向量机就是由 Cython 构建。在监督学习部分,Scikit-learn 提供了广义线性模型、支持向量机、最近邻算法、高斯过程、朴素贝叶斯、决策树和集成方法等算法教程,同时还介绍了特征选择、随即梯度下降算法、线性与二次判别分析等在监督学习中非常重要的概念。 除了监督学习,半监督学习中的标签传播算法和无监督学习中的聚类与降维算法都有非常多的教程。此外,在模型选择中,文档教程描述了交叉验证的使用、估计器超参数的调整、模型评估方法和模型持久化概念等。 数据预处理是机器学习非常重要的部分,我们可以使用归一化等方法大大降低前向传播与学习算法的计算复杂度,也可以利用缺失值插补和特征提取等方法增加数据的有效性。以下选取了 SVM 的部分使用教程,读者可借此了解 Scikit-learn 中文文档的组织形式与基本内容,更完整的内容前查看原文档。支持向量机 (SVMs) 可用于以下监督学习算法分类、回归和异常检测。支持向量机的优势在于:在高维空间中非常高效。 即使在数据维度比样本数量大的情况下仍然有效。在决策函数(称为支持向量)中使用训练集的子集,因此它也是高效利用内存的。通用性:不同的核函数 核函数 与特定的决策函数一一对应。支持向量机的缺点包括:如果特征数量比样本数量大得多,在选择核函数时要避免过拟合,而且正则化项是非常重要的。支持向量机不直接提供概率估计,这些都是使用昂贵的五次交叉验算计算的。在 scikit-learn 中,支持向量机提供 dense(numpy.ndarray , 可以通过 numpy.asarray 进行转换) 和 sparse(任何 scipy.sparse)样例向量作为输出。然而,要使用支持向量机来对 sparse 数据作预测,它必须已经拟合这样的数据。使用 C 代码的 numpy.ndarray (dense) 或者带有 dtype=float64 的 scipy.sparse.csr_matrix (sparse) 来优化性能。分类SVC、NuSVC 和 LinearSVC 能在数据集中实现多元分类:SVC 和 NuSVC 是相似的方法,但是接受稍许不同的参数设置并且有不同的数学方程。另一方面,LinearSVC 是另一个实现线性核函数的支持向量分类。记住 LinearSVC 不接受关键词 kernel,因为它被假设为线性的。它也缺少一些 SVC 和 NuSVC 的成员(members)比如 support_。和其他分类器一样,SVC、NuSVC 和 LinearSVC 将两个数组作为输入:[n_samples, n_features] 大小的数组 X 作为训练样本,[n_samples] 大小的数组 y 作为类别标签 (字符串或者整数):>>> from sklearn import svm

>>> X = [[0, 0], [1, 1]]

>>> y = [0, 1]

>>> clf = svm.SVC()

>>> clf.fit(X, y)

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,

decision_function_shape='ovr', degree=3, gamma='auto', kernel='rbf',

max_iter=-1, probability=False, random_state=None, shrinking=True,

tol=0.001, verbose=False)在拟合后, 这个模型可以用来预测新的值:>>> clf.predict([[2., 2.]])

array([1])SVMs 决策函数取决于训练集的一些子集, 称作支持向量. 这些支持向量的部分特性可以在 support_vectors_、support_和 n_support 找到:>>> # 获得支持向量

>>> clf.support_vectors_

array([[ 0., 0.],

[ 1., 1.]])

>>> # 获得支持向量的索引get indices of support vectors

>>> clf.support_

array([0, 1]...)

>>> # 为每一个类别获得支持向量的数量

>>> clf.n_support_

array([1, 1]...)

以上是 SVM 简单的介绍,这些内容都由 ApacheCN 翻自 Scikit-learn 。最后,感谢参与翻译文档的志愿者,正因为他们,开源社区才能有如此高质量的学习资料。编辑于 2018-04-06 23:57机器学习人工智能​赞同 443​​12 条评论​分享​喜欢​收藏​申请转载​文章被以下专栏收录机器之心关注人工智能学术和技yload":{"allShortcutsEnabled":false,"fileTree":{"":{"items":[{"name":"asset","path":"asset","contentType":"directory"},{"name":"docs","path":"docs","contentType":"directory"},{"name":"img","path":"img","contentType":"directory"},{"name":"src","path":"src","contentType":"directory"},{"name":".gitignore","path":".gitignore","contentType":"file"},{"name":".nojekyll","path":".nojekyll","contentType":"file"},{"name":"404.html","path":"404.html","contentType":"file"},{"name":"CONTRIBUTING.md","path":"CONTRIBUTING.md","contentType":"file"},{"name":"Dockerfile","path":"Dockerfile","contentType":"file"},{"name":"LICENSE","path":"LICENSE","contentType":"file"},{"name":"NAV.md","path":"NAV.md","contentType":"file"},{"name":"README.md","path":"README.md","contentType":"file"},{"name":"SUMMARY.md","path":"SUMMARY.md","contentType":"file"},{"name":"ads.txt","path":"ads.txt","contentType":"file"},{"name":"cover.md","path":"cover.md","contentType":"file"},{"name":"index.html","path":"index.html","contentType":"file"},{"name":"update.sh","path":"update.sh","contentType":"file"}],"totalCount":17}},"fileTreeProcessingTime":19.642409,"foldersToFetch":[],"repo":{"id":104967369,"defaultBranch":"master","name":"sklearn-doc-zh","ownerLogin":"apachecn","currentUserCanPush":false,"isFork":false,"isEmpty":false,"createdAt":"2017-09-27T03:25:03.000Z","ownerAvatar":"https://avatars.githubusercontent.com/u/24802038?v=4","public":true,"private":false,"isOrgOwned":true},"symbolsExpanded":false,"treeExpanded":true,"refInfo":{"name":"master","listCacheKey":"v0:1634191550.4799948","canEdit":false,"refType":"branch","currentOid":"6fbef7c2850dd509b958c49a9e0fc98de968ef20"},"path":"README.md","currentUser":null,"blob":{"rawLines":null,"stylingDirectives":null,"colorizedLines":null,"csv":null,"csvError":null,"dependabotInfo":{"showConfigurationBanner":false,"configFilePath":null,"networkDependabotPath":"/apachecn/sklearn-doc-zh/network/updates","dismissConfigurationNoticePath":"/settings/dismiss-notice/dependabot_configuration_notice","configurationNoticeDismissed":null},"displayName":"README.md","displayUrl":"https://github.com/apachecn/sklearn-doc-zh/blob/master/README.md?raw=true","headerInfo":{"blobSize":"9.47 KB","deleteTooltip":"You must be signed in to make or propose changes","editTooltip":"You must be signed in to make or propose changes","ghDesktopPath":"https://desktop.github.com","isGitLfs":false,"onBranch":true,"shortPath":"9723f3f","siteNavLoginPath":"/login?return_to=https%3A%2F%2Fgithub.com%2Fapachecn%2Fsklearn-doc-zh%2Fblob%2Fmaster%2FREADME.md","isCSV":false,"isRichtext":true,"toc":[{"level":1,"text":"scikit-learn (sklearn) 官方文档中文版","anchor":"scikit-learn-sklearn-官方文档中文版","htmlText":"scikit-learn (sklearn) 官方文档中文版"},{"level":2,"text":"介绍","anchor":"介绍","htmlText":"介绍"},{"level":2,"text":"下载","anchor":"下载","htmlText":"下载"},{"level":3,"text":"Docker","anchor":"docker","htmlText":"Docker"},{"level":3,"text":"PYPI","anchor":"pypi","htmlText":"PYPI"},{"level":3,"text":"NPM","anchor":"npm","htmlText":"NPM"},{"level":2,"text":"目录","anchor":"目录","htmlText":"目录"},{"level":2,"text":"历史版本","anchor":"历史版本","htmlText":"历史版本"},{"level":2,"text":"贡献指南","anchor":"贡献指南","htmlText":"贡献指南"},{"level":2,"text":"DOCX:开放共享科研记录行动倡议","anchor":"docx开放共享科研记录行动倡议","htmlText":"DOCX:开放共享科研记录行动倡议"},{"level":2,"text":"项目负责人","anchor":"项目负责人","htmlText":"项目负责人"},{"level":2,"text":"贡献者","anchor":"贡献者","htmlText":"贡献者"},{"level":2,"text":"建议反馈","anchor":"建议反馈","htmlText":"建议反馈"},{"level":2,"text":"项目协议","anchor":"项目协议","htmlText":"项目协议"},{"level":2,"text":"赞助我们","anchor":"赞助我们","htmlText":"赞助我们"}],"lineInfo":{"truncatedLoc":"221","truncatedSloc":"172"},"mode":"file"},"image":false,"isCodeownersFile":null,"isPlain":false,"isValidLegacyIssueTemplate":false,"issueTemplate":null,"discussionTemplate":null,"language":"Markdown","languageID":222,"large":false,"planSupportInfo":{"repoIsFork":null,"repoOwnedByCurrentUser":null,"requestFullPath":"/apachecn/sklearn-doc-zh/blob/master/README.md","showFreeOrgGatedFeatureMessage":null,"showPlanSupportBanner":null,"upgradeDataAttributes":null,"upgradePath":null},"publishBannersInfo":{"dismissActionNoticePath":"/settings/dismiss-notice/publish_action_from_dockerfile","releasePath":"/apachecn/sklearn-doc-zh/releases/new?marketplace=true","showPublishActionBanner":false},"rawBlobUrl":"https://github.com/apachecn/sklearn-doc-zh/raw/master/README.md","renderImageOrRaw":false,"richText":"scikit-learn (sklearn) 官方文档中文版\n\n\n\n \n sklearn 0.21.3 中文文档\n sklearn 0.21.3 中文示例\n sklearn 英文官网\n \n\n\n\n介绍\nsklearn (scikit-learn) 是基于 Python 语言的机器学习工具\n\n简单高效的数据挖掘和数据分析工具\n可供大家在各种环境中重复使用\n建立在 NumPy ,SciPy 和 matplotlib 上\n开源,可商业使用 - BSD许可证\n\n\n组织构建[网站]\n\n\nGitHub Pages(国外): https://sklearn.apachecn.org\nGitee Pages(国内): https://apachecn.gitee.io/sklearn-doc-zh\n\n\n第三方站长[网站]\n\n\n地址A: xxx (欢迎留言,我们完善补充)\n\n\n其他补充\n\n\n官方Github\nEPUB 下载地址\nApacheCN 翻译校对兼职群 713436582\n\n下载\nDocker\ndocker pull apachecn0/sklearn-doc-zh\ndocker run -tid -p :80 apachecn0/sklearn-doc-zh\n# 访问 http://localhost:{port} 查看文档\n\nPYPI\npip install sklearn-doc-zh\nsklearn-doc-zh \n# 访问 http://localhost:{port} 查看文档\n\nNPM\nnpm install -g sklearn-doc-zh\nsklearn-doc-zh \n# 访问 http://localhost:{port} 查看文档\n\n目录\n\n安装 scikit-learn\n用户指南\n\n1. 监督学习\n\n1.1. 广义线性模型\n1.2. 线性和二次判别分析\n1.3. 内核岭回归\n1.4. 支持向量机\n1.5. 随机梯度下降\n1.6. 最近邻\n1.7. 高斯过程\n1.8. 交叉分解\n1.9. 朴素贝叶斯\n1.10. 决策树\n1.11. 集成方法\n1.12. 多类和多标签算法\n1.13. 特征选择\n1.14. 半监督学习\n1.15. 等式回归\n1.16. 概率校准\n1.17. 神经网络模型(有监督)\n\n\n2. 无监督学习\n\n2.1. 高斯混合模型\n2.2. 流形学习\n2.3. 聚类\n2.4. 双聚类\n2.5. 分解成分中的信号(矩阵分解问题)\n2.6. 协方差估计\n2.7. 新奇和异常值检测\n2.8. 密度估计\n2.9. 神经网络模型(无监督)\n\n\n3. 模型选择和评估\n\n3.1. 交叉验证:评估估算器的表现\n3.2. 调整估计器的超参数\n3.3. 模型评估: 量化预测的质量\n3.4. 模型持久化\n3.5. 验证曲线: 绘制分数以评估模型\n\n\n4. 检验\n\n4.1. 部分依赖图\n\n\n5. 数据集转换\n\n5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器\n5.2. 特征提取\n5.3 预处理数据\n5.4 缺失值插补\n5.5. 无监督降维\n5.6. 随机投影\n5.7. 内核近似\n5.8. 成对的矩阵, 类别和核函数\n5.9. 预测目标 (y) 的转换\n\n\n6. 数据集加载工具\n\n6.1. 通用数据集 API\n6.2. 玩具数据集\n6.3 真实世界中的数据集\n6.4. 样本生成器\n6.5. 加载其他数据集\n\n\n7. 使用scikit-learn计算\n\n7.1. 大规模计算的策略: 更大量的数据\n7.2. 计算性能\n7.3. 并行性、资源管理和配置\n\n\n\n\n教程\n\n使用 scikit-learn 介绍机器学习\n关于科学数据处理的统计学习教程\n\n机器学习: scikit-learn 中的设置以及预估对象\n监督学习:从高维观察预测输出变量\n模型选择:选择估计量及其参数\n无监督学习: 寻求数据表示\n把它们放在一起\n寻求帮助\n\n\n处理文本数据\n选择正确的评估器(estimator.md)\n外部资源,视频和谈话\n\n\nAPI 参考\n常见问题\n时光轴\n\n历史版本\n\nscikit-learn (sklearn) 0.19 官方文档中文版\nscikit-learn (sklearn) 0.18 官方文档中文版\n\n如何编译使用历史版本:\n\n解压 0.19.x.zip 文件夹\n将 master/img 的图片资源, 复制到 0.19.x 里面去\ngitbook 正常编译过程,可以使用 sh run_website.sh\n\n贡献指南\n为了不断改进翻译质量,我们特此启动了【翻译、校对、笔记整理活动】,开设了多个校对项目。贡献者校对一章之后可以领取千字2~4元的奖励。进行中的校对活动请见活动列表。更多详情请联系飞龙(Q562826179,V:wizardforcel)。\nDOCX:开放共享科研记录行动倡议\n我们积极响应科研开源计划(DOCX)。如今开源不仅仅是开放源码,还包括数据集、模型、教程和实验记录。我们也在探讨其它类别的开源方案和协议。\n希望大家了解这个倡议,把这个倡议与自己的兴趣点结合,做点力所能及的事情。每个人的微小的贡献,汇聚在一起就是整个开源生态。\n项目负责人\n格式: GitHub + QQ\n\n第一期 (2017-09-29)\n\n\n@那伊抹微笑\n@片刻\n@小瑶\n\n\n第二期 (2019-06-29)\n\n\n@N!no:1352899627\n@mahaoyang:992635910\n@loopyme:3322728009\n飞龙:562826179\n片刻:529815144\n\n-- 负责人要求: (欢迎一起为 sklearn 中文版本 做贡献)\n\n热爱开源,喜欢装逼\n长期使用 sklearn(至少0.5年) + 提交Pull Requests>=3\n能够有时间及时优化页面 bug 和用户 issues\n试用期: 2个月\n欢迎联系: 片刻 529815144\n\n贡献者\n【0.19.X】贡献者名单\n建议反馈\n\n在我们的 apachecn/pytorch-doc-zh github 上提 issue.\n发邮件到 Email: apachecn@163.com.\n在我们的 QQ群-搜索: 交流方式 中联系群主/管理员即可.\n\n项目协议\n\n最近有很多人联系我们,关于内容授权问题!\n开源是指知识应该重在传播和迭代(而不是禁止别人转载)\n不然你TM在GitHub开源,然后又说不让转载,你TM有病吧!\n禁止商业化,符合协议规范,备注地址来源,重点: 不需要发邮件给我们申请\nApacheCN 账号下没有协议的项目,一律视为 CC BY-NC-SA 4.0。\n\n温馨提示:\n\n对于个人想自己copy一份再更新的人\n我也是有这样的经历,但是这种激情维持不了几个月,就泄气了!\n不仅浪费了你的心血,还浪费了更多人看到你的翻译成果!很可惜!你觉得呢?\n个人的建议是: fork -> pull requests 到 https://github.com/apachecn/sklearn-doc-zh\n那为什么要选择 ApacheCN 呢?\n因为我们做翻译这事情是觉得开心和装逼,比较纯粹!\n你如果喜欢,你可以来参与/甚至负责这个项目,没有任何学历和背景的限制\n\n赞助我们\n\n","renderedFileInfo":null,"shortPath":null,"symbolsEnabled":true,"tabSize":8,"topBannersInfo":{"overridingGlobalFundingFile":false,"globalPreferredFundingPath":null,"showInvalidCitationWarning":false,"citationHelpUrl":"https://docs.github.com/github/creating-cloning-and-archiving-repositories/creating-a-repository-on-github/about-citation-files","actionsOnboardingTip":null},"truncated":false,"viewable":true,"workflowRedirectUrl":null,"symbols":{"timed_out":false,"not_analyzed":false,"symbols":[{"name":"scikit-learn (sklearn) 官方文档中文版","kind":"section_1","ident_start":2,"ident_end":63,"extent_start":0,"extent_end":9700,"fully_qualified_name":"scikit-learn (sklearn) 官方文档中文版","ident_utf16":{"start":{"line_number":0,"utf16_col":2},"end":{"line_number":0,"utf16_col":49}},"extent_utf16":{"start":{"line_number":0,"utf16_col":0},"end":{"line_number":221,"utf16_col":0}}},{"name":"介绍","kind":"section_2","ident_start":710,"ident_end":716,"extent_start":707,"extent_end":1471,"fully_qualified_name":"介绍","ident_utf16":{"start":{"line_number":16,"utf16_col":3},"end":{"line_number":16,"utf16_col":5}},"extent_utf16":{"start":{"line_number":16,"utf16_col":0},"end":{"line_number":40,"utf16_col":0}}},{"name":"下载","kind":"section_2","ident_start":1474,"ident_end":1480,"extent_start":1471,"extent_end":1870,"fully_qualified_name":"下载","ident_utf16":{"start":{"line_number":40,"utf16_col":3},"end":{"line_number":40,"utf16_col":5}},"extent_utf16":{"start":{"line_number":40,"utf16_col":0},"end":{"line_number":66,"utf16_col":0}}},{"name":"Docker","kind":"section_3","ident_start":1486,"ident_end":1492,"extent_start":1482,"extent_end":1640,"fully_qualified_name":"Docker","ident_utf16":{"start":{"line_number":42,"utf16_col":4},"end":{"line_number":42,"utf16_col":10}},"extent_utf16":{"start":{"line_number":42,"utf16_col":0},"end":{"line_number":50,"utf16_col":0}}},{"name":"PYPI","kind":"section_3","ident_start":1644,"ident_end":1648,"extent_start":1640,"extent_end":1754,"fully_qualified_name":"PYPI","ident_utf16":{"start":{"line_number":50,"utf16_col":4},"end":{"line_number":50,"utf16_col":8}},"extent_utf16":{"start":{"line_number":50,"utf16_col":0},"end":{"line_number":58,"utf16_col":0}}},{"name":"NPM","kind":"section_3","ident_start":1758,"ident_end":1761,"extent_start":1754,"extent_end":1870,"fully_qualified_name":"NPM","ident_utf16":{"start":{"line_number":58,"utf16_col":4},"end":{"line_number":58,"utf16_col":7}},"extent_utf16":{"start":{"line_number":58,"utf16_col":0},"end":{"line_number":66,"utf16_col":0}}},{"name":"目录","kind":"section_2","ident_start":1873,"ident_end":1879,"extent_start":1870,"extent_end":6026,"fully_qualified_name":"目录","ident_utf16":{"start":{"line_number":66,"utf16_col":3},"end":{"line_number":66,"utf16_col":5}},"extent_utf16":{"start":{"line_number":66,"utf16_col":0},"end":{"line_number":142,"utf16_col":0}}},{"name":"历史版本","kind":"section_2","ident_start":6029,"ident_end":6041,"extent_start":6026,"extent_end":6485,"fully_qualified_name":"历史版本","ident_utf16":{"start":{"line_number":142,"utf16_col":3},"end":{"line_number":142,"utf16_col":7}},"extent_utf16":{"start":{"line_number":142,"utf16_col":0},"end":{"line_number":153,"utf16_col":0}}},{"name":"贡献指南","kind":"section_2","ident_start":6488,"ident_end":6500,"extent_start":6485,"extent_end":6865,"fully_qualified_name":"贡献指南","ident_utf16":{"start":{"line_number":153,"utf16_col":3},"end":{"line_number":153,"utf16_col":7}},"extent_utf16":{"start":{"line_number":153,"utf16_col":0},"end":{"line_number":158,"utf16_col":0}}},{"name":"DOCX:开放共享科研记录行动倡议","kind":"section_2","ident_start":6868,"ident_end":6911,"extent_start":6865,"extent_end":7325,"fully_qualified_name":"DOCX:开放共享科研记录行动倡议","ident_utf16":{"start":{"line_number":158,"utf16_col":3},"end":{"line_number":158,"utf16_col":20}},"extent_utf16":{"start":{"line_number":158,"utf16_col":0},"end":{"line_number":164,"utf16_col":0}}},{"name":"项目负责人","kind":"section_2","ident_start":7328,"ident_end":7343,"extent_start":7325,"extent_end":8156,"fully_qualified_name":"项目负责人","ident_utf16":{"start":{"line_number":164,"utf16_col":3},"end":{"line_number":164,"utf16_col":8}},"extent_utf16":{"start":{"line_number":164,"utf16_col":0},"end":{"line_number":190,"utf16_col":0}}},{"name":"贡献者","kind":"section_2","ident_start":8159,"ident_end":8168,"extent_start":8156,"extent_end":8256,"fully_qualified_name":"贡献者","ident_utf16":{"start":{"line_number":190,"utf16_col":3},"end":{"line_number":190,"utf16_col":6}},"extent_utf16":{"start":{"line_number":190,"utf16_col":0},"end":{"line_number":194,"utf16_col":0}}},{"name":"建议反馈","kind":"section_2","ident_start":8259,"ident_end":8271,"extent_start":8256,"extent_end":8533,"fully_qualified_name":"建议反馈","ident_utf16":{"start":{"line_number":194,"utf16_col":3},"end":{"line_number":194,"utf16_col":7}},"extent_utf16":{"start":{"line_number":194,"utf16_col":0},"end":{"line_number":200,"utf16_col":0}}},{"name":"**项目协议**","kind":"section_2","ident_start":8536,"ident_end":8552,"extent_start":8533,"extent_end":9600,"fully_qualified_name":"**项目协议**","ident_utf16":{"start":{"line_number":200,"utf16_col":3},"end":{"line_number":200,"utf16_col":11}},"extent_utf16":{"start":{"line_number":200,"utf16_col":0},"end":{"line_number":218,"utf16_col":0}}},{"name":"赞助我们","kind":"section_2","ident_start":9603,"ident_end":9615,"extent_start":9600,"extent_end":9700,"fully_qualified_name":"赞助我们","ident_utf16":{"start":{"line_number":218,"utf16_col":3},"end":{"line_number":218,"utf16_col":7}},"extent_utf16":{"start":{"line_number":218,"utf16_col":0},"end":{"line_number":221,"utf16_col":0}}}]}},"copilotInfo":null,"copilotAccessAllowed":false,"csrf_tokens":{"/apachecn/sklearn-doc-zh/branches":{"post":"8sq2yggapQNnYx9V-qgVXxZ0plKpiEWYBO_RMSsxWopEKjOZ4gK8ioh5E2L2IgvvoGWibRxQRY37nR_AkGHH9g"},"/repos/preferences":{"post":"7Y120f0bfAq385JM7kv_gTToBU1xc2npub264xgxfXR_KbfEKVGYkNLnuwH9UxSvZQWKBKuZKba6Evs_2yorhQ"}}},"title":"sklearn-doc-zh/README.md at master · apachecn/sklearn-doc-z

scikit-learn: machine learning in Python — scikit-learn 1.4.1 documentation

scikit-learn: machine learning in Python — scikit-learn 1.4.1 documentation

Install

User Guide

API

Examples

Community

Getting Started

Tutorial

What's new

Glossary

Development

FAQ

Support

Related packages

Roadmap

Governance

About us

GitHub

Other Versions and Download

More

Getting Started

Tutorial

What's new

Glossary

Development

FAQ

Support

Related packages

Roadmap

Governance

About us

GitHub

Other Versions and Download

scikit-learn

Machine Learning in Python

Getting Started

Release Highlights for 1.4

GitHub

Simple and efficient tools for predictive data analysis

Accessible to everybody, and reusable in various contexts

Built on NumPy, SciPy, and matplotlib

Open source, commercially usable - BSD license

Classification

Identifying which category an object belongs to.

Applications: Spam detection, image recognition.

Algorithms:

Gradient boosting,

nearest neighbors,

random forest,

logistic regression,

and more...

Examples

Regression

Predicting a continuous-valued attribute associated with an object.

Applications: Drug response, Stock prices.

Algorithms:

Gradient boosting,

nearest neighbors,

random forest,

ridge,

and more...

Examples

Clustering

Automatic grouping of similar objects into sets.

Applications: Customer segmentation, Grouping experiment outcomes

Algorithms:

k-Means,

HDBSCAN,

hierarchical

clustering,

and more...

Examples

Dimensionality reduction

Reducing the number of random variables to consider.

Applications: Visualization, Increased efficiency

Algorithms:

PCA,

feature selection,

non-negative matrix factorization,

and more...

Examples

Model selection

Comparing, validating and choosing parameters and models.

Applications: Improved accuracy via parameter tuning

Algorithms:

grid search,

cross validation,

metrics,

and more...

Examples

Preprocessing

Feature extraction and normalization.

Applications: Transforming input data such as text for use with machine learning algorithms.

Algorithms:

preprocessing,

feature extraction,

and more...

Examples

News

On-going development:

scikit-learn 1.5 (Changelog)

February 2024. scikit-learn 1.4.1.post1 is available for download (Changelog).

January 2024. scikit-learn 1.4.0 is available for download (Changelog).

October 2023. scikit-learn 1.3.2 is available for download (Changelog).

September 2023. scikit-learn 1.3.1 is available for download (Changelog).

June 2023. scikit-learn 1.3.0 is available for download (Changelog).

All releases:

What's new (Changelog)

Community

About us: See authors and contributing

More Machine Learning: Find related projects

Questions? See FAQ and stackoverflow

Subscribe to the mailing list

Gitter: gitter.im/scikit-learn

Blog: blog.scikit-learn.org

Logos & Branding: logos and branding

Calendar: calendar

Twitter: @scikit_learn

LinkedIn: linkedin/scikit-learn

YouTube: youtube.com/scikit-learn

Facebook: @scikitlearnofficial

Instagram: @scikitlearnofficial

TikTok: @scikit.learn

Communication on all channels should respect PSF's code of conduct.

Help us, donate!

Cite us!

Who uses scikit-learn?

"We use scikit-learn to support leading-edge basic research [...]"

"I think it's the most well-designed ML package I've seen so far."

"scikit-learn's ease-of-use, performance and overall variety of algorithms implemented has proved invaluable [...]."

"The great benefit of scikit-learn is its fast learning curve [...]"

"It allows us to do AWesome stuff we would not otherwise accomplish"

"scikit-learn makes doing advanced analysis in Python accessible to anyone."

More testimonials

scikit-learn development and maintenance are financially supported by