课程介绍
网络世界有大量以语言和社交网络形式存在的非结构化信息。学习如何使用神经网络和其他机器学习工具来理解这些信息,并通过语言形式与人类互动——如回答问题、提供建议等!斯坦福 CS124 就是一门聚焦文本类数据与信息挖掘应用的课程。
CS124 课程主题内容涉猎非常广,包含算法(如文本处理、编辑距离、语言模型、机器学习分类器、神经嵌入、倒排索引、协同过滤、PageRank 等)、应用(如聊天机器人、情感分析、信息检索、问答、文本分类、推荐系统等)。课程对于帮助构建NLP中的全域概念和不同应用板块的算法理解非常有帮助。
课程讲师 Dan Jurafsky,语言学(Linguistics)教授,斯坦福计算机系教授,研究自然语言处理及其在社会和认知科学中的应用,是书籍《Speech and Language Processing》《The Language of Food: A Linguist Reads the Menu》的作者之一。
课程主题
CS124 的课程形式是『翻转课堂』,在课堂完成10节课程,包含:开始与结束的2场面对面讲座、5 个面对面的Team Work和 3次面对面的讲授。其余课程都已经预先录制完成,参与课程需认真研究课程表并做好准备。本门课程包含 7 个主题,ShowMeAI 对其进行了整理。
- 文本基础知识与预处理方法
- 基础模型与文本分类问题
- 信息检索问题与解决方案
- 文本语义与向量表征
- NLP高阶任务与方法模型(序列标注、神经语言模型、对话系统)
- 推荐系统与方法
- 网络数据与社交网络挖掘分析
课程资料 | 下载
扫描上方图片二维码,关注公众号并回复关键字 🎯『CS124』,就可以获取整理完整的资料合辑啦!当然也可以点击 🎯 这里 查看更多课程的资料获取方式!
ShowMeAI 对课程资料进行了梳理,整理成这份完备且清晰的资料包:
- 📚 课件-PDF。Lecture 1~14所有章节。
- 📚 课程代码-数据文件和.ipynb文件。7个压缩包,整理了课程涉及项目和代码实现。
- 📚 相关书籍与笔记-PDF。课程推荐的学习资料。
课程视频 | B站
ShowMeAI 将视频上传至B站,并增加了中英双语字幕,以提供更加友好的学习体验。点击页面视频,可以进行预览。推荐前往 👆 B站 观看完整课程视频哦!
本门课程,ShowMeAI 将部分章节进行了切分,按照主题形成更短小的视频片段,便于按照标题进行更快速的检索。切分后的视频清单列写在这里:
章节编号 | 章节内容 |
---|---|
第01讲 | 文本预处理 |
第02讲 | 编辑距离 |
第03讲 | 语言模型 |
第04讲 | 朴素贝叶斯与文本分类 |
第05讲 | 逻辑回归 |
第06讲 | 信息检索-第1部分 |
第07讲 | 信息检索-第2部分 |
第08讲 | 语义向量与文本嵌入 |
第09讲 | 序列标注及其在词性和实体标注中的应用 |
第10讲 | 简单神经网络与神经语言模型 |
第11讲 | 聊天机器人与对话系统 |
第12讲 | 从协同过滤到推荐系统 |
第13讲 | 网络与链接分析 |
第14讲 | 社交网络分析 |
根据视频内容整理的这份『CS124 课程结构图解』,展示了内容要点及其逻辑关系,超级直观!相信对构建 Whole Picture 特别有帮助~