74. 深度学习完成假新闻分类#

74.1. 介绍#

深度学习在自然语言处理中有十分重要的应用,实际上前面的循环神经网络内容中,已经接触过相关的知识。本次挑战需要借助前面学习过的知识,提升假新闻文本分类的准确率。

74.2. 知识点#

  • 文本分类

  • 深度神经网络

实验中,我们使用了 WSDM 假新闻分类数据学习了文本分类的过程。不过,实验的结果并不特别理想,测试集准确度基本 \(65\%\) 左右。本次挑战中,你需要利用文本分类实验中学习到的数据预处理技巧,以及前面深度学习中学过的相关知识,对假新闻数据重新分类。

Exercise 74.1

开放型挑战

挑战:利用文本分类预处理及深度学习知识,构建深度神经网络对假新闻数据进行分类。

规定:对提供的数据进行 \(8:2\) 切分,最终测试集准确度 \(>70\%\)。你可以自由选择文本预处理方法,特征提取手段,以及深度神经网络结构。

挑战需使用实验中提供的假新闻数据。

https://cdn.huhuhang.com/hands-on-ai/files/wsdm_mini.csv  # 假新闻数据
## 补充代码 ###