简繁汉字转换系统电脑版下载v0.12
这个工具由 厦门大学智能科学与技术系自然语言处理研究组 研发、厦门大学自然语言处理实验室 出品,提供了字、词、术语、标点等不同层次的转换功能,以及网页转换服务,转换准确率高于国内外同类产品。
软件特色:
使用说明:
本系统向用户提供了单机版简繁汉字转换工具。该工具无需安装,可直接在Windows命令行界面下运行。
注意:由于简繁汉字转换系统需要大规模语言模型,因此本工具要求在64位操作系统下运行(建议采用Microsoft Windows7 x64 或 Microsoft Windows Server 2008 R2 x64),而且机器必须装有8G以上内存。
1. 运行
打开windows命令提示符,切换到单机版简繁汉字转换工具所在目录,输入jf,根据相关提示,进一步设置相关参数,即可使用简繁汉字智能转换系统的全部功能(如图1所示)。
2. 命令行模式
工具中提供了命令行模式供用户使用,目前仅支持简转繁。具体操作方法:
(1)输入jf -lm lm_s2t.txt -c进入命令行模式(如图2所示,其中lm_s2t.txt为语言模型文件;由于语言模型规模较大,加载需要等待几分钟时间)。
(2)在命令行模式下,输入h可查看使用提示(如图2所示)。
(3)在命令行模式下,输入简体文本,命令行界面返回转换后的繁体文本(如图2所示)。
3. 文件转换
工具中提供了文件转换功能供用户使用,支持简转繁和繁转简。具体操作方法:
(1)文件简转繁:输入jf -jf file1.txt file2.txt -lm lm_s2t.txt(其中file1.txt为简体原文文件,file2.txt为输出转换结果的目标文件名,lm_s2t.txt为语言模型文件)。
(2)文件繁转简:输入jf -fj file1.txt file2.txt -lm lm_s2t.txt(其中file1.txt为繁体原文文件,file2.txt为输出转换结果的目标文件名,lm_s2t.txt为语言模型文件)。
4. 面向古籍的简繁转换
工具中提供了面向古籍的简繁转换功能供用户使用。与普通转换(面向台湾的简繁转换)使用方法相似,只需在命令中带上选项-ac。具体操作方法:
(1)命令行模式:输入jf -lm lm_s2a.txt -c -ac进入面向古汉语的命令行模式(如图3所示,其中lm_s2a.txt为古汉语语言模型文件;由于语言模型规模较大,加载需要等待几分钟时间)。
(2)文件简转繁:输入jf -jf file1.txt file2.txt -lm lm_s2a.txt(其中file1.txt为简体原文文件,file2.txt为输出转换结果的目标文件名,lm_s2a.txt为古汉语语言模型文件)。
(3)文件繁转简:输入jf -fj file1.txt file2.txt -lm lm_s2a.txt(其中file1.txt为繁体原文文件,file2.txt为输出转换结果的目标文件名,lm_s2a.txt为古汉语语言模型文件)。
5. 异体字转正体字功能
在命令行模式下,采用fj2 infile outfile方式可以把infile中的异体字转为正体字并保存在outfile,其中用到两个数据文件k2n.txt 与a2n.txt,分别表示转换表,用户可以修改。
6. 评测功能
本工具提供了对简繁转换结果进行评测的功能,具体操作方法如下:
(1)按前文第2节介绍的方式进入命令行模式。
(2)在命令行模式下,输入diff gold.txt test.txt diff.html即可进行评测(如图4所示),其中gold.txt为标准答案,test.txt为待评价的转换结果,diff.html为指定的对比结果输出文件。
(3)用浏览器打开diff.html,即可查看系统输出的对比结果(如图5所示),点击页面上方的链接“跳到与原文不一致的字表”,自动定位到页面下方的统计结果(如图6所示)。

资源来自于网络,版权属于作者,仅供交流学习,如喜欢,请支持正版。
网盘/磁力链接已被隐藏,请根据提示用微信扫码获取
