NEUNLPLab>>NiuParser主页>>常见问题



常见问题

Q:对于每一个功能而言,输入文件都是原始的中文文件吗?
A:不是。NiuParser提供的所有功能之间存在依赖关系,即要使用某个功能的时候,输入文件必须是该功能所依赖的功能处理后的结果。具体来说:
      自动分词的输入文件是原始的中文数据文件。
      词性标注的输入文件是经自动分词处理的输出文件。
      命名实体识别的输入文件是经词性标注处理的输出文件。
      组块识别的输入文件是经词性标注处理的输出文件。
      成分句法分析的输入文件是经词性标注处理的输出文件。
      依存句法分析的输入文件是经词性标注处理的输出文件。
      语义角色标注的输入文件是经成分句法分析处理的输出文件。
Q:NiuParser都支持什么编码的文件?
A:目前,NiuParser只支持UTF-8编码的文件。若编码格式非UTF-8,在使用时会有相应的错误提示信息。
Q:原始的中文文件必须是一行一句的格式吗?
A:是的,目前NiuParser只支持原始文件的格式为一行一句。NiuParser目前不支持篇章级处理,即暂不提供分句功能。如果用户原始数据是篇章,请用户自行分句,转成一行一句的格式后方可使用NiuParser处理。
Q:NiueParser分词功能是否支持用户词典?
A:支持。具体用法请查阅 NiuParser使用手册
Q:我有自己的分词和词性标注系统,我只想使用NiuParser的依存分析功能,可以办到吗?
A:可以。NiuParser提供的所有功能是相对独立的,并没有耦合在一起。
      用户如果希望只使用NiuParser的依存分析功能,只需要将自己的词性标注结果格式转换成NiuParser使用的词性标注格式即可。
      需要注意的是,输入的词性标注结果必须采用宾大中文树库的规范。
      用户替换其他功能时,原则是相似的。即,只需要把用户自身系统的结果转化为符合要求的格式即可。具体格式说明请查阅NiuParser使用手册
Q:使用NiuParser进行完成分句法分析后,对其结果进行语义角色标注时,为什么会提示“Constituent Parser tree format error in line ***”?
A:这个错误产生的原因是输入的成分句法树格式有错。可能的原因是成分句法分析失败,输出的不是一棵句法树,而是森林。可以尝试在最外层加上括号来解决。