什么是“核文器”?

核文器是核对文章的工具,与核武器没有任何关系。

“核文器”能找出什么样的错误?

核文器内置中文词库、英文词库和常见错误词库,可以找出文章内的中英文错误词汇。

“核文器”速度如何?

虽然目前核文器处于测试阶段,但程序已经进行过基本优化,5000字的文章校对可在1秒以内完成。

为什么我提交的词没有被收录?

我们会经常查看大家提交的词,但不是所有的词都可以被收录,尤其是双字词的收录会非常仔细小心。比如:“西安”和“西按”,作为名词“西按”一定是错误的,但是在“我用力向西按去。”这句中“西按”虽不是词但也没有错误,为了保证这种情况,此类可能发生歧义的词不会被收录。

校对原理是什么?

对于英文单词的校对方法很成熟,首先通过对正确单词库的比较判断是否有拼写错误,然后根据概率分析单词可能的正确拼写,选择最优输出。

中文校对比较困难,无法通过概率分析。假设有七万个常用汉字,双字词可能出现的错误组合就有十四万种结果,3字词、4字词就更不用说了。所以本系统采用错误词库和正确词库相结合的方式用于中文校对。

核文器最大难点是什么?

核文器开发过程遇到最大的难点是分词,目前分词模块都是要依赖词库的,由于这是一个校对系统,所以我们认为输入的文本是有潜在问题的,有问题的词句如何能够正确的分词?系统无法正确分词,也只好对错误词进行选择性登记,有些常见字组成的错误词恐怕无法正确识别。