hummingbird/fastNLP: 一款轻量级的自然语言处理（NLP）工具包，目标是减少用户项目中的工程型代码，例如数据处理循环、训练循环、多卡运行等 - reproduction/joint_cws_parse/readme.md at d54122f73d7a8512b8c3d865b3a4445620856821 - fastNLP - 开源协同云脑生态支撑系统

779 B

Raw Blame History

准备数据
运行代码
其它

Code for paper A Unified Model for Chinese Word Segmentation and Dependency Parsing

准备数据

数据应该为conll格式，1, 3, 6, 7列应该对应为'words', 'pos_tags', 'heads', 'labels'.
将train, dev, test放在同一个folder下，并将该folder路径填入train.py中的data_folder变量里。
从百度云(提取:ua53)下载预训练vector，放到同一个folder下，并将train.py中vector_folder变量正确设置。

运行代码

python train.py

其它

ctb5上跑出论文中报道的结果使用以上的默认参数应该就可以了(应该会更高一些); ctb7上使用默认参数会低0.1%左右，需要调节
learning rate scheduler.