|
|
@@ -1,10 +1,17 @@ |
|
|
|
##基于自然语言处理的情感分析工具 |
|
|
|
|
|
|
|
##请注意: |
|
|
|
## 请注意: |
|
|
|
>1. pom.xml 文件中 lingpipe-core jar 没办法从中央仓库下载已经集成到 libs 目录里面,而 pom.xml 中只能使用绝对路径,请注意修改 |
|
|
|
>2. pom.xml 文件中 hanlp jar 包可能需要手动下载,然后添加到 maven 仓库 |
|
|
|
|
|
|
|
###本程序依赖data目录下面的data.zip和dictionary.zip先解压缩 data 目录下面的 data.zip到当前目录。 |
|
|
|
### 本程序依赖data目录下面的data.zip和dictionary.zip先解压缩 data 目录下面的 data.zip到当前目录。 |
|
|
|
|
|
|
|
### 设计思想 |
|
|
|
专注某一个领域,比如军事、经济、政府等,利用互联网上的数据。 |
|
|
|
>首先训练一个专业领域与非专业其它领域的二分类器。 |
|
|
|
>然后在对新的样本判断是否是该领域的 |
|
|
|
>训练一个情感分类器,判断这个样本是该领域的正面信息还是负面信息。 |
|
|
|
|
|
|
|
|
|
|
|
### 新增说明3:增加基于 TF-IDF(词向量) 特征的文本分类程序。 |
|
|
|
1. 主程序:DfIdfClassifier.java |
|
|
|