From 92555e504a6df5ce37f6cb423dfeec43a7631817 Mon Sep 17 00:00:00 2001
From: OpenCT <lhf@mail.bnu.edu.cn>
Date: Wed, 5 Jun 2024 18:56:13 +0800
Subject: [PATCH] Update README.md

---
 README.md | 28 ++++++++++++++++++++++++++--
 1 file changed, 26 insertions(+), 2 deletions(-)

diff --git a/README.md b/README.md
index e359f56..cf9ab14 100644
--- a/README.md
+++ b/README.md
@@ -2,7 +2,7 @@
 # 北师大OpenCT社区/OpenCT-AI文本数据挖掘项目
 
 ## 项目背景
-北师大OpenCT社区/OpenCT-AI项目是OpenCT社区的一个重要子项目，旨在基于大语言模型，对文本类大规模教育资料进行分析和挖掘，生成详细的分析报告。项目依托北京师范大学的科研资源和技术优势，结合最新的自然语言处理技术，为教育研究和实践提供智能化的解决方案。
+北师大OpenCT社区/OpenCT-AI项目是OpenCT社区的一个重要子项目，旨在基于大语言模型，对文本类大规模教育资料进行分析和挖掘，生成详细的分析报告。项目依托北京师范大学的科研资源和技术优势，结合最新的自然语言处理技术，为教育研究和实践提供智能化的解决方案，提高质性数据的分析效率。
 
 ## 项目内容
 该项目主要包括以下几个方面：
@@ -12,7 +12,7 @@
 - 调用大语言模型接口对采集的文本数据进行预处理，包括数据清洗、格式转换和标注，确保数据的质量和一致性。
 
 ### 大语言模型训练与优化
-- 基于最新的大语言模型（如GPT-4），对教育文本数据进行训练和优化，提升模型的理解和生成能力。
+- 基于最新的大语言模型（如GPT-4），对教育文本数据进行训练和优化，对数据进行自动编码，提升模型的理解和生成能力。
 - 不断更新和扩展模型的知识库，确保模型对最新教育内容的掌握和应用。
 
 ### 教育文本分析与挖掘
@@ -35,5 +35,29 @@
 2. **技术交流与合作**：加入我们的线上交流社区QQ群（389801885），与其他开发者和研究者进行技术交流和合作。
 3. **论文撰写参与**：参与项目学术论文的撰写和投稿，获得宝贵的科研经验和指导。
 
+## 目标
+- 提供一个基于大语言模型的教育文本数据挖掘系统，能够对大规模教育文本资料进行深度分析和挖掘，生成详细的分析报告。
+- 提高教育研究和实践中质性数据的分析效率，提供智能化的解决方案。
+
+## 难度
+  中等
+
+## 产出要求
+- 设计并实现一个教育文本数据挖掘模型，包括数据预处理、模型训练与优化、文本分析与挖掘、自动化报告生成等功能。
+- 撰写详细的使用文档，说明如何使用和部署系统。
+- 对系统进行测试和优化，确保其性能和准确性。
+
+## 能力要求
+- 熟悉Python编程语言。
+- 熟悉常见的自然语言处理和机器学习算法。
+- 了解大语言模型的训练与优化技术。
+- 熟悉数据挖掘和分析技术。
+- 熟悉Markdown文档撰写。
+
+## 导师
+- 邵越洋（联系邮箱：89982416@qq.com）
+
+
+
 ## 结语
 北师大OpenCT社区/OpenCT-AI项目致力于通过开源和协作，推动教育文本分析和挖掘的创新发展。我们期待更多的计算机专业学生参与进来，共同为教育赋能，为技术创新贡献力量。让我们一起，探索教育文本分析的未来！