| @@ -1,10 +1,17 @@ | |||||
| ##基于自然语言处理的情感分析工具 | ##基于自然语言处理的情感分析工具 | ||||
| ##请注意: | |||||
| ## 请注意: | |||||
| >1. pom.xml 文件中 lingpipe-core jar 没办法从中央仓库下载已经集成到 libs 目录里面,而 pom.xml 中只能使用绝对路径,请注意修改 | >1. pom.xml 文件中 lingpipe-core jar 没办法从中央仓库下载已经集成到 libs 目录里面,而 pom.xml 中只能使用绝对路径,请注意修改 | ||||
| >2. pom.xml 文件中 hanlp jar 包可能需要手动下载,然后添加到 maven 仓库 | >2. pom.xml 文件中 hanlp jar 包可能需要手动下载,然后添加到 maven 仓库 | ||||
| ###本程序依赖data目录下面的data.zip和dictionary.zip先解压缩 data 目录下面的 data.zip到当前目录。 | |||||
| ### 本程序依赖data目录下面的data.zip和dictionary.zip先解压缩 data 目录下面的 data.zip到当前目录。 | |||||
| ### 设计思想 | |||||
| 专注某一个领域,比如军事、经济、政府等,利用互联网上的数据。 | |||||
| >首先训练一个专业领域与非专业其它领域的二分类器。 | |||||
| >然后在对新的样本判断是否是该领域的 | |||||
| >训练一个情感分类器,判断这个样本是该领域的正面信息还是负面信息。 | |||||
| ### 新增说明3:增加基于 TF-IDF(词向量) 特征的文本分类程序。 | ### 新增说明3:增加基于 TF-IDF(词向量) 特征的文本分类程序。 | ||||
| 1. 主程序:DfIdfClassifier.java | 1. 主程序:DfIdfClassifier.java | ||||