diff --git a/README.md b/README.md index 05eecf0..eaa73a4 100644 --- a/README.md +++ b/README.md @@ -1,10 +1,17 @@ ##基于自然语言处理的情感分析工具 -##请注意: +## 请注意: >1. pom.xml 文件中 lingpipe-core jar 没办法从中央仓库下载已经集成到 libs 目录里面,而 pom.xml 中只能使用绝对路径,请注意修改 >2. pom.xml 文件中 hanlp jar 包可能需要手动下载,然后添加到 maven 仓库 -###本程序依赖data目录下面的data.zip和dictionary.zip先解压缩 data 目录下面的 data.zip到当前目录。 +### 本程序依赖data目录下面的data.zip和dictionary.zip先解压缩 data 目录下面的 data.zip到当前目录。 + +### 设计思想 +专注某一个领域,比如军事、经济、政府等,利用互联网上的数据。 +>首先训练一个专业领域与非专业其它领域的二分类器。 +>然后在对新的样本判断是否是该领域的 +>训练一个情感分类器,判断这个样本是该领域的正面信息还是负面信息。 + ### 新增说明3:增加基于 TF-IDF(词向量) 特征的文本分类程序。 1. 主程序:DfIdfClassifier.java