什么是机器学习
机器学习系统是基于学习训练,然后,分析未曾见过的数据,并产生有价值的结论或预测。
Labels
Label,即我们预测的结果。Linear regression 的 Y 变量。
Label 可以是预测的小麦价格,图片中的动物,一段音频的翻译。
Features
Feature,即输入的变量。Linear regression 的 X 变量。
- 简单的机器学习项目,可能只使用一个 Feature。
- 而复杂的项目,可能使用成百上千个 Feature, 例如,X1, X2, … XN.
在垃圾邮件判定中,可能包含的 Feature:
- 邮件字数
- 发件人地址
- 邮件的发送时间
- 关键字
Examples
Example, 即数据实例,真实样本。
Example 分为两类:
- Labeled examples: 同时包含 label 和 feature, (x, y)。机器学习中使用 labeled examples 去训练 model.
- Unlabeled examples: 只包含 feature, 而没有 label。一旦我们训练好 model, 我们就会使用 model 去推测 unlabeled examples 的 label。
Models
Model 定义了 features 和 label 的关系。
Model 包含了两个过程:
- Training,训练。即,利用 labeled examples 去建立 features 与 label 的关系。
- inference,推断。将 trained model 应用于 unlabeled examples. 即推测出 y.
regression 与 classification 的区别
Regression 是推测连续的值。例如,随时间变化的股价。
Classification 是回答是与否的问题。例如,照片里是不是个人。
Linear regression
线性回归。这个名字太拗口了。
线性回归的应用场景:
- 趋势。随时间变化的值,例如石油价格,股票价格等。
- 宏观经济数据。预测劳动力需求等。
参考:https://zh.wikipedia.org/wiki/%E7%B7%9A%E6%80%A7%E5%9B%9E%E6%AD%B8
参考
https://developers.google.cn/machine-learning/crash-course/framing/ml-terminology
微信关注我哦 👍
我是来自山东烟台的一名开发者,有感兴趣的话题,或者软件开发需求,欢迎加微信 zhongwei 聊聊, 查看更多联系方式