Python
未读前言一个很粗糙的新闻文本分类项目,解决中国软件杯第九届新闻文本分类算法的问题,记录了项目的思路及问题解决方法
后续会进一步改进,包括:
丰富训练集的数据,避免军事类、房产类、体育类的新闻数据过少,影响精度
改用上限更高的Bert模型
优化exe文件的页面,使其能够分别处理识别短文本和excel文件
项目源码:https://github.com/bluehyssopu/NewSort
项目问题链接:http://cnsoftbei.com/plus/view.php?aid=599
- code
- -pycache- ---pyinstaller 打包生成的文件
- build ---pyinstaller 打包生成的文件
- dist ---pyinstaller 打包生成的文件(内有 软件test2.exe 可运行)
- showTest.ipynb - ...
