机器学习简介

阿里云双11来了!从本博客参与阿里云,服务器最低只要86元/年!

简介

机器学习基本概念,原理,历史,未来趋势,常见算法
语音识别
ocr
图像检测
机器翻译
风格迁移
NLP(自然语言处理)
搜索引擎
。。。。
算法模型 训练集 测试集 验证集

5W2H
how machines learning works:
1. select data (training data,
 validation data,test data) -> 训练集 测试集 验证集
2. Model data(训练集构建相关特征的model) ->
3. Validate Model ->
4. test model ->
5. use the model ->
6.  Tune model 
Machines can 'learn' by analyzing large amounts of data.
数据科学Work Flow:
获取(数据存在不同的格式) -> 检查和探索 -> 清理和准备 -> 建模 -> 评估 -> 最后的部署

数据科学的工作流程

  1. 获取:
    不同的数据源,不同的数据格式
  2. 检查和探索:
    合理地检查数据
    检查最极端的情况
    统计测试,并将数据可视化
    数据是否缺失或者不完整
    Jupyter pandas matplotlib
    Seaborn = 专门为统计可视化创建的库
  3. 清理和准备
    转换为适合于模型使用的格式
    过滤 – 聚集 – 输入 – 转化
  4. 建模
    选择适当的算法,并在数据上训练出一个模型
    将数据分割为训练 测试和验证的集合
  5. 评估
    模型构建完成并开始进行预测
    实际值与评估之间的距离测量
  6. 部署
    一个定制的Web应用程序,甚至是一个简单的cron作业

常见机器学习算法

  1. 决策树(Decision Tree)
NLP
nlu 自然语言理解包括三块:
1. 领域识别
2. 意图识别
3. 槽填充

参考链接: http://www.cyzone.cn/article/159742.html

https://www.jianshu.com/p/8147455974a3

Python量化投资网携手4326手游为资深游戏玩家推荐:《战火与秩序下载

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论