贪心学院NLP自然语言处理训练营 百度云 百度网盘 网盘

阿里云2000元红包!本站用户参与享受九折优惠!

1算法与机器学习基础


image

实战案例

基于Sparse Quadratic Programming的股票投资组合优化策略编写

基于Earth Mover’s Distance的短文本相似度计算

基于Projected Gradient Descent和非负矩阵分解的词向量学习

基于Linear Programming的机票定价系统

基于DTW的文本相似度分析

核心知识点

时间复杂度,空间复杂度分析

Master’s Theorem,递归复杂度分析

动态规划以及Dynamic Time Warpping

Earth Mover’s Distance

维特比算法

LR、决策树、随机森林、XGBoost

梯度下降法、随机梯度下降法、牛顿法

Projected Gradient Descent

L0, L1, L2, L-Infinity Norm

Grid Search, Bayesian Optimization

凸函数、凸集、Duality、KKT条件

Linear SVM、Dual of SVM

Kernel Tick, Mercer’s Theorem

Kernelized Linear Regression、Kernelized KNN

Linear/Quadratic Programming

Integer/Semi-definite Programming

NP-completeness/NP-hard/P/NP

Constrained Relaxation、Approximate Algorithm

Convergence Analysis of Iterative Algorithm

2语言模型与序列标注


image

实战案例

基于无监督学习方法的问答系统搭建

基于监督学习的Aspect-Based 情感分析系统搭建

基于CRF、LSTM-CRF、BERT-CRF 的命名实体识别应用

基于语言模型和Noisy Channel Model的拼写纠错

核心知识点

文本预处理技术(tf-idf,Stemming等)

文本领域的特征工程

倒排表、信息检索技术

Noisy Channel Model

N-gram模型,词向量介绍

常见的Smoothing Techniques

Learning to Rank

Latent Variable Model

EM算法与Local Optimality

Convergence of EM

EM与K-Means, GMM

Variational Autoencoder与Text Disentangling

有向图与无向图模型

Conditional Indepence、D-separation、Markov Blanket

HMM模型以及参数估计

Viterbi、Baum Welch

Log-Linear Model与参数估计

CRF模型与Linear-CRF

CRF的Viterbi Decoding与参数估计

3信息抽取、词向量与知识图谱


image

实战案例

利用非结构化数据和信息抽取技术构建知识图谱

任务导向型聊天机器人的搭建

包含Intent与Entity Extraction的NLU模块实现

基于SkipGram的推荐系统实现(参考Airbnb论文)

核心知识点

命名实体识别技术

信息抽取技术

Snowball, KnowitAll, RunnerText

Distant Supervision, 无监督学习方法

实体统一、实体消歧义、指代消解

知识图谱、实体与关系

词向量、Skip-Gram、Negative Sampling

矩阵分解、CBOW与Glove向量

Contexualized Embedding与ELMo

KL Divergence与Gaussian Embedding

非欧式空间与Pointcare Embedding

黎曼空间中的梯度下降法

知识图谱嵌入技术

TransE, NTN 的详解

Node2Vec详解

Adversial Learning与KBGAN

4深度学习与NLP


image

实战案例

利用纯Python实现BP算法

基于Seq2Seq+注意力机制、基于Transformer的机器翻译系统

基于Transformer的闲聊型聊天机器人

基于BI-LSTM-CRF和BERT-BiLSTM-CRF在命名实体中的比较

利用Laywer-wise RP可视化端到端的机器翻译系统

核心知识点

Pytorch与Tensorflow详解. 表示学习,分布式表示技术

文本领域中的Disentangling

深度神经网络与BP算法详解

RNN与Vanishing/Exploding Gradient

LSTM与GRU

Seq2Seq与注意力机制

Greedy Decoding与Beam Search

BI-LSTM-CRF模型

Neural Turing Machine

Memory Network

Self Attention,Transformer以及Transformer-XL.

Bert的详解

BERT-BiLSTM-CRF

GPT,MASS, XLNet

Low-resource learning

深度学习的可视化

Laywer-wise Relevance Propagation

5贝叶斯模型与NLP


image

实战案例

利用Collapsed Gibbs Sampler和SGLD对主题模型做Inference

基于Bayesian-LSTM的命名实体识别

利用主题模型做文本分类在

LDA的基础上修改并搭建无监督情感分析模型

核心知识点

概率图模型与条件独立

Markov Blanket

Dirichlet分布、Multinomial分布

Beta分布、Conjugate Prior回顾

Detail Balance

主题模型详解

MCMC与吉布斯采样

主题模型与Collapsed Gibbs Sampling

Metropolis Hasting, Rejection Sampling

Langevin Dyamics与SGLD

分布式SGLD与主题模型

Dynamic Topic Model

Supervised Topic Model

KL Divergence与ELBO

Variantional Inference, Stochastic VI

主题模型与变分法

Nonparametric Models

Dirichlet Process

Chinese Restarant Process

Bayesian Deep Neural Network

VAE与Reparametrization trick

Bayesian RNN/LSTM

Bayesian Word2Vec

MMSB

6Capstone 开放式项目(Optional)


image

往期学员项目展示

搭建辅助医疗诊断的智能问答系统

LDA主题模型的平滑处理方法研究

基于知识驱动的对话聊天机器人

基于深度学习的命名实体识别研究

项目展示

什么是Capstone项目?

  • 项目介绍

    开放式项目又称为课程的capstone项目。作为 课程中的很重要的一部分,可以选择work on 一个具有挑战性的项目。通过此项目,可以深 入去理解某一个特定领域,快速成为这个领域 内的专家,并且让项目成果成为简历中的一个 亮点。

    • 项目流程

    Step 1: 组队

    Step 2: 立项以及提交proposal

    Step 3: Short Survey Paper

    Step 4: 中期项目Review Step

    5: 最终项目PPT以及代码提交

    Step 6: 最终presentation

    Step 7: Technical Report/博客

    • 结果输出

    完整PPT、代码和Conference-Style Technical Report 最为项目的最后阶段,我们 将组织学员的presentation分享大会。借此我 们会邀请一些同行业的专家、从业者、企业招 聘方、优质猎头资源等共同参与分享大会。

Capstone项目选题方向有哪些?
学员可以选择自己感兴趣的项目来做,可以是 自己在公司中遇到的问题,也可以纯粹中自己 的兴趣出发,也可以是偏学术性的。主要分成 四个方向:应用型、工具型、论文复现性/总 结型的、研究性质的。

  • 应用型项目

    选定一个特定领域(比如医疗,汽车行业, 法律等等),并构建此领域的知识图谱, 然后基于知识图谱搭建问答系统。 此项目 的难点在于数据获取这一端。

    • 工具型项目

    课程里涉及到了很多NLP核心的技术,比 如拼写纠错,分词,NER识别,关系抽 取,POS识别等等,而且市面上也有一些 开源的工具比如HanNLP, 哈工大NLP, 结 巴等等。 有没有可能自己写出在某些问题 上更好的NLP相关的API呢,然后再开源?

    • 论文复现性/总结型项目

    我们可以选择一些比较前沿的技术而且 “重要”的论文来做复现,可以偏向于是系 统实现,也可以是对某一个技术的总结。 例如:利用深度增强学习的方式来搭建 聊天机器人(参考https://arxiv.org/pdf/ 1709.02349.pdf)。

    • 研究型项目

    研究是具有挑战性的,其中很重要的问题 是选题。基于个人的兴趣,narrow down 到一个特定的问题。我们将在研究的过程 中给一些思路上的指导,最终达到发表一 篇论文的目的。

资料领取请加微信,加微信备注 贪心NLP


加V.jpg
https://www.jianshu.com/p/942569451489

Python量化投资网携手4326手游为资深游戏玩家推荐:《《苍蓝誓约》:战列装备限时UP补偿说明

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论