(Chinese GB2312 text) BGconv 1.0.35 简繁转换工具 软件名称:BGconv 简繁转换工具 ║版本:1.0.35 ║分类:补缀工具 ║环境:win98/2K/XP 简体中文/繁体中文 ║性质:免费软件 ║主页: http://cpatch.org/glossary/ 程序:陈宽达 (Kuan-Ta Chen) ║mailto:xshadow@cpatch.org ║网页: http://kuan.ilife.cx/ 字符集对照表格: 黄国书 (Kii Ali) 词汇转译表格: 黄国书 (Kii Ali) ║mailto:kiiali@cpatch.org ║ICQ:5107476 ║网页: http://cpatch.org/kiiali/ ■1.0.35 修改范围 0. v1.0.35 主程序 EXE 会有转换不完全的错误,因此改为使用 2002-05-07 的 EXE 版本。 1.词汇对照表: + 一个简体字对多个繁体字的判别。出于 Kii Ali 的报告。 添加 2275 个对照组。可以做底下的简繁互换测试 繁体 简体 豆干 豆干 乾隆 乾隆 (注意这个 "乾" 在简体仍然会 "乾") 干燥 干燥 干预 干预 师范 师范 头发 头发 发生 发生 顺发 顺发 荡秋千 荡秋千 2.词库大幅扩张。当前如下。 缩写字 term_acronym.tab 计算机 term_computer_b2g.tab 计算机 term_computer_both.tab 计算机 term_computer_g2b.tab 文件 term_document_both.tab 文件 term_file_b2g.tab 文件 term_file_both.tab 文件夹 term_folder_both.tab 字体id term_fontid_b2g.tab 字体id term_fontid_both.tab 语言id term_langid.tab 生活 term_living.tab 词汇转换 term_phrase.tab 地名 term_placename.tab 单词 term_singleword.tab 工作 term_task_both.tab 着迷 term_zhaomi_gb2312.tab ■1.0.36 预计修改范围 1.字码对照表: (未完成) + 字码表转换范围加大,纳入造字范围 (中国海) 和 GBK extension。 BIG5 (原): A140 - F97E , A1A1 - F9FE BIG5 (现): 8240 - FE7E , 82A0 - FEFE GB2312 (原): A1A1 - F7FE GB2312 (现): 8240 - FE7E , 82A0 - FEFE (与 BIG5 一致) 2. 解决 v1.0.35“只做部分更换”的问题。 3.多个 Option, 针对 *.rc *.htm *.txt 或其他文件, 4.可按鼠标右键,直接转换 B->G。 Eudora Plugins 的部分,增加 可转换 UTF-8 编码。 ■BGconv 软件描述 这是 Kii Ali 麻烦陈宽达做的程序。用来转换 GB2312 <-> BIG5 的字码,并同时转换常用的词汇,因为两岸的计算机辞汇不 相同,实在是个大问题。我都是拿来做为简体中文化的工具。 用途 1: 把繁体 RC, TXT, HTM 等等文件,转换成简体。 用途 2: 包含两岸词汇校正。 用途 3: 包含 [逆向] 简转繁 功能。 用途 4: GB2312 <-> UTF 8 <-> BIG5 也可以啦。 当然,BGconv 不能代表全部的转换,到此完美,却可以省下不少力 气。之前也有许多朋友跟我要,总算有个可见人的版本了。 ■声明 程序内建的“字码、词汇对照表”为 Kii Ali 所提供,欢迎用于 非商业性中文化作品制作、或其他非营利、非商业性使用。格式为 文本档。 “字码、词汇对照表”部分将会是公益软件,并由 Kii 不定期更新 。虽然它只是纯文本文件,除非 Kii 书面同意,不欢迎用于商业性 加值利用,亦不欢迎于“任何”商业营利型网站提供下载。用户 应有此认知。 ■BGconv 特点 1.Win32 GUI/command line 皆可运行。方便您做批次转换,或是做 GUI 方式转换文字。请打开 bgconv.doc 便可知道 commandline 的 参数用法。 2.可自行定义转换辞汇。BGconv 会自动在第一次运行时 compile 词库。 您可以使用 UltraEdit 修改,或直接在 BGconv 内修改。也可以选 择该文要不要转换辞汇。 格式如下: (S: Source term D: Destination term) S 计算机 D 计算机 S 重命名 D 重命名 S 新信 D 新邮件 S 页边距 D 页边距 3.可自行定义 BGconv 的 Big5, Gb2312 字码对换表。 文件: gb2bg.map GB2312 <-> BIG5 字码镜像表。 bg2gb.map GB2312 <-> BIG5 字码镜像表。 格式: (内码后面的任何文字,皆为注解,系统不会处理) A1A1 A140 ﹛   A1A2 A142 ﹜ 、 A1A3 A143 ﹝ 。 A1A4 A145 ﹞ · A1A5 A1C2 ‘  ̄ A1A6 2020 ’ 4.显示 即使在繁体中文 win98 底下,可直接用“宋体”“宋体”显示 转换结果。 5.换行处理 5.1 按照原始格式:维持文章原有缩排。若启用辞汇替换机 制,可能使每行文字长度有所变动。 5.2 不换行:完全不换行,视为同一段落,适合贴入具备换 行功能或排版功能的软件,如 UltraEdit 或 Word。 5.3 程序自动换行:放弃文章原有缩排,填入每行文字长度, 由程序自动为您换行。 ■一些质疑 有人会说:Word 2000 不是内建有简繁转换的功能吗,转码又可 以转词。 是的,您可以拿 wordconv.txt 当模板给 Word2000 转换看看。 常规计算机用语仅 40 分,多媒体 0 分,生活用语 20 分 。根 本不能信任。 ■词汇说明 简体中文化工具 - 繁简词汇转换 在做英文软件的简体中文化时,通常,会先把英文软件翻译成繁 体中文,等到调试完,再进一步做简体中文的版本。如果是 *.rc 档,流程将会如下 英文 rc 档 => 繁体中文 rc 档 => 调整对话框 => 简体中文 rc 档 虽然我们可以不做用词的转换,直接 big5 <-> GB2312 转换 rc 档就可以中文化了,虽可接受,但总不满意。我们看到大陆的用 词,“软件”“光盘”“横向平铺窗口”或许不难懂,但“网关 ”“句柄”“假脱机数据格式”“后台操作”很多人就要搞不懂 了。至于 “文件(big5) = 文件(gb)” “文件(big5) = 文档(gb)” “链接(big5) = 链接(gb)” “连线(big5) = 连接(gb)” 这种两岸都在用却各自定义不同的词汇,更叫人昏头转向。另外 ,台湾的翻译以动词型态为多,如“链接选择”,大陆则是“链 接选择”,名词型态并不少。 因此,找出和比对了 cwin98, pwin98 两版所有程序的 resource (大概有六万多行吧,绝对会比对到头昏的) ,再找出 mfc 和 vb 所定义的标准话语,整理出对照表。希望能突破文化上翻译的困境 ,让大家对简体中文化能尽快上手。 ■文件下载 □原始文件 (737KB) 香港中大 ftp://ftp.cuhk.edu.hk/pub/cpatch/patchutil/bgconv/bgconv1035.exe 台湾大学 ftp://ftp.ntu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 中山大学 ftp://ftp.nsysu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 中央大学 ftp://ftp.ncu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 成功大学 ftp://ftp.ncku.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 交通大学 ftp://hw-driver.nctu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 中兴大学 ftp://ftp.nchu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 暨南大学 ftp://ftp.ncnu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 台湾科大 ftp://ftp.ntust.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 台北科大 ftp://ftp.ntut.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 屏东科大 ftp://ftp.ntut.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 淡江大学 ftp://ftp.tku.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 辅仁大学 ftp://ftp.fju.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 元智大学 ftp://ftp.yzu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 义守大学 ftp://ftp.isu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 东海大学 ftp://ftp.thu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 静宜大学 ftp://ftp.pu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 大叶大学 ftp://ftp.dyu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 中华大学 ftp://ftp.chu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 中原大学 ftp://ftp.cycu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 昆山科大 ftp://ftp.ksut.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 龙华科大 ftp://ftp.lhu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 新竹师院 ftp://ftp.nhctc.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 成大电机 ftp://ftp.ee.ncku.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 交大资科 ftp://ftp.cis.nctu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 逢甲纺织 ftp://ftp.te.fcu.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe 中县教网 ftp://ftp.boe.tcc.edu.tw/cpatch/patchutil/bgconv/bgconv1035.exe ■安装方式 NSIS 2.0a7 多语言安装格式。 在中文化前,请详阅 bgconv1035.txt 文件。 无须取得原英文版本,下载后直接安装即可。默认安装目录为 "C:\UTIL\BGconv\" ■Kxx 的垃圾文章 ===================================================== 如果有人喜欢看,请引用底下 Kxx 的垃圾文章。 ===================================================== Date: Fri, 26 Oct 2001 22:14:16 +0800 To: "patch-author List Member" From: Kii Ali Subject: [patch-author] gb-b5 对照表“又再做一次” {01} 我没有开玩笑,但的确这次“又再做一次”。原理很简单。 1.在 cwin98 底下,把所有 big5 的排列组合全部印出来。 ,也包含“中国海字符集”。总共 16 页。多少字就不用提了。 含造字的内码范围,包含 7E40-FE7E 7EA0-FEFE 2.在 pwin98 底下,把所有 GB2312 和所有 gbk 扩充字符集 全部印出来,也是 16 页。 含造字的内码范围,包含 7E40-FE7E (GBK 内码范围,里面包含相当多对 BIG5 的兼容字) 7EA1-7EFE (GB2312 范围,和其他杂项) 然后,人工比对,真不是人干的事情。 之前我曾经综合了 evdict ,译典通,大陆金山字典,他们 的转换表多少都会有一些缺陷。尤其是在表格字符,和一些特别 在 GBK 里面有提供字,但是常规对照表未找到的。 至于 evdict 和其他,多多少少对照表有问题,转换还是照样漏 字者一堆。我不敢说自己的对照表没有缺陷,简体转繁体我不敢 担保。但是繁体转简体,应该是都够了。只要看到那一堆表格字, 双线表格、单线表格、半单半双表格、粗线表格,然后切来切去 转来转去,你会跟我一样很有脑袋烧坏的顾虑。还好啦,仅 一万出头的字,也不会太难。(苦笑) GBK 的扩充字面非常庞大,几乎包含所有的繁体字,我想暂时 不去动它了。喂,把那一堆做完会死人的。但感触很深,大陆 订的 GBK 码延伸性的确够高,比起早有缺陷又无法改进的 BIG5 ,如果你知道有些 pwin98 的字无法顺利转换为繁体字, 那真的会干到没力。虽然这种简体字实在非常少出现。比如 河北省“禾蒿”城县。这个“禾蒿”字非常难写,“禾”是在 下面而“蒿”是在上面的。 unicode 呢?我没有仔细看。不过的确如单教授的文章所提,多半 是削足适履的作法。把繁体和简体的一些字,各削一些掉,然后 跟日文韩文挤在一起的后果。 =============================================================== 旧版本文件,以其值得参考,故列如下。 =============================================================== ■1.0.34 更版说明 3.支持多个转码表 (已完成) 可随时选择要替换专有名词,还是只替换特定用语,包含 term_acronym.tab" 大陆惯用字头缩写词汇 term_b2g_only.tab" 只用于 BIG5 -> GB2312 转换 term_computer.tab" 计算机词汇校正 term_fontid.tab" 转换字体专用 term_g2b_only.tab" 只用于 GB2312->BIG5 转换 term_gb2312_zhu.tab" 校正“著”字,在简体里面有两个用法校正 term_langid.tab" 语言 RC 的转码映射校正 term_living.tab" 大陆生活用法校正 term_phrase.tab" 大陆文法用词校正 term_placename.tab" 地名人名翻译用语校正 term_singleword.tab" 单一字校正 4.设置数值改为 BGconv.ini 文件方式,不再使用注册表项目。 完全的可携性。 ■1.0.33 更版说明 1.程序: + 同时支持繁体简体 win98/win2k 底下的作业。 + 改变图标,与 Eudora plugins 一致。 + 字码对照表可使用 ";" 为注解,或使用空白行。 + 词汇对照表可使用 ";" 为注解,或使用空白行。 ! 解决 wordconv.txt 日期检查,导致当机问题。 ! 解决 wordb2g.txt wordg2b.txt 大小不为零时,无法重新 再行编译 termb2g.tab termg2b.tab ,导致当机问题。 ! 解决 wordb2g.txt wordg2b.txt 文件不存在,无法运行问题。 ! 解决多余的 button1 问题。 2.词汇对照表: ! 更新和停用部分大陆地区俚俗词语。 3.转换优先顺序: + 繁体(BIG5) : 先以转 GB2312 为主,若未找到则找 GBK extension。 + 繁体(中国海造字) : 先以转 GB2312 为主,若未找到则 找 GBK extension。 + 简体(GB2312): 先以转 BIG5 为主,未找到则找中国海 范围,但尽量不使用。音标、重音节字母、俄文、希腊 文、日文、数字序列号、特别符号,皆从中国海规格。 + 简体(GBK extension): 其中的繁体字,先以转 BIG5 为 主,未找到则找中国海范围,但尽量不使用。出现双线 表格则可在 BIG5 范围找到。 4.字码对照表: + BIG5 -> GB2312 使用部分 GBK 延伸字符集,但尚未完 全支持,这需要时间。 + 双线和单线表格字符集支持。添加 GBK extension 段落的表格字符。 + 开始支持中国海部分字符集,映射于 GBK extension 段落找到的部分。 ■ 1.0.32 改采用了陈宽达 BGconv 架构,所有的 mapping table 均可自定义。 ■ 1.31 1.31 版本:特别感谢 brucez 对 eudora 的简体支持,因此才产生了 这个版本。 ■ 1.3 1.多媒体词汇 弟刚到某视频多媒体公司上任,取得了不少中国大陆多媒体的技术手册。 强迫自己看完整本“英汉广播电视常用缩语手册”。再加上最近到深圳 一趟,运行简体中文化的心得。 这就是硬逼著自己,干完整本字典的结果。 另外,大陆北京与南方深圳等地的用语已有不同,南方多受香港影响,而 香港又受台湾影响,因此在广州深圳等地的计算机用语已有不同,如 digital ,北方称“数字”,深圳和香港“数码”,台湾“数字”等等。 2.逆向 (简->繁) 功能 重新提供。 注意:逆向转换弟并没有相当仔细的校阅,使用务请小心。 ■ 1.2 版更版说明 1.两岸的文字转换 常常在两岸文字上转换的朋友,大概会都碰到这个问题:BIG5 对 GB2312 并不是一对一转换的。也因此繁体转简体通常没有问题,而简体转回繁体 就问题多多。 原因很简单,大陆在推行简体字之后,很多字的意思被合并掉了,甚至两 字合为一字。而这些字在台湾还有原来的意义。比如说... 吊 吊 = 吊 e.g. (台湾) 吊桥 吊唁 (大陆) 吊桥 吊唁 奸 奸 = 奸 e.g. (台湾) 强奸 奸诈 (大陆) 强奸 奸诈 范 范 = 范 e.g. (台湾) 范仲淹 规范 (大陆) 范仲淹 规范 注 注 = 注 e.g. (台湾) 注册 注意 (大陆) 注册 注意 游 游 = 游 e.g. (台湾) 游戏 游泳 (大陆) 游戏 游泳 乾 干 = 干 e.g. (台湾) 干燥 干涉 (大陆) 干燥 干涉 以上的字,在 GB2312 的编码下看起来都相同 (字被合并了),但在 BIG5 编码底下看起来,和台湾民众的实际用法上,却是有所分别。有些简化的 的确实际,有些让台湾民众看起来“很不习惯”。 因此,我把这部分找出来了。怎么找的?BIG5 字符集 5401 个常用字 , 一个一个繁体简体人工比对。大概还有遗漏吧,还请诸方家指正。 比对这个,实在不是人干的任务。后面七千多个次常用字比对,欢迎 有人接力下去。 2.rehot.pro 如果您使用 cpatch 1.3 来做翻译,会发现 cpatch 1.3 在翻译完的句子上 hotkey 的位置不对。这个小程序就是来代换 hotkey 位置,和剔除部分常见 垃圾子句用的。 ■ 1.1 版更版说明 1.宏代换词库,膨胀一倍。 原先都是计算机词汇的代换为主。已经可以解决大部分问题,但没有完整 生活用语的对照。因为我尽可能把找到的两岸不同生活用语加进去,甚至 包含国名对照、俚俗语、名人译名两岸不同、政府单位、两岸地名等。欲求 用字用词上,能够更符合对岸的习惯。 大部分的词库参考于此地: http://china.management.org.tw/usua_word/home.htm ■更版前的考虑事项 很少有软件叫人不要更换版本的。 :) 偏偏这种 copyLEFT 的软件,考虑比较多。 1.运行时间增加一倍 当然, RC 转换的精确度也提高不少。本来如果你的中文化 rc 档想做简体, 大概从 80 分的水准,可以拉到 90 分吧。以 teleport 1.29 (949) 在 486 上的转换,要 20 分钟的时间。加上调试,浪费的时间相当可观。如果您急着 丢出中文化懒得调试,那么换词也可以省了,用转码器转过去,反正大陆同胞 也大部分看得懂,套上 vc 就是所谓“完美简体中文化”了。 如果您像我一样,追求用词完美极致,那就换版吧。 2.完美简体中文化?(纯 murmur) 至于要 95 分?我想得到大陆住个几年才成。马英九或宋楚瑜讲台语,大家都 听得懂,只是讲得“轮不轮转”而已。简体中文化的意味也是如此。就像用 客家话硬翻“土地公”而不用客家人习称的“伯公”,恐怕也没有几个客家人 听得下去,因为没有人这样用。 这个宏,只不过尽可能试图把“土地公”转成“伯公”,让大陆人容易接受罢了。 100 分完美中文化?啊,没有这种东西啦。我的经验是,凡是在作品上号称 “完美中文化”的,通常下载之后,后悔居多。(笑) ■在中文化之前 两岸的计算机用词一直是个问题。这问题太大了。JQJQ 之前介绍弟使用两岸简繁通 ,号称可以转词兼转码,虽然可以用,可惜词汇对照表实在太少,在软件的翻译 上仍不免出现一堆问题,是以不用。这是文化上的问题,想要凭弟一己之力,让 对岸的大陆朋友看弟中文化的软件顺眼,毕竟奢求。不是看不懂,却总是怪怪的 ,难道没有更好的方法吗? 两岸计算机词汇对照表,有,在台北重庆南路“政府出版物中心可以”找到,不过 实在有些陈腐而不实用。网络上也可以找,行政院陆委会有做一个,但以生活用 语为多,计算机用词没几个。march 所服务的台擎公司虽有,但总不好拿别人现成 的工具。 因此,我挖出了 cwin98, pwin98 的 shell33.dll 的 resource 档,人工比对 出一堆名词对照表,勉强可用,但总不满意。后来,狠下心,把两个版本 win98 所有的 *.exe, *.dll, *.drv, *.cpl 全挖出来,用 bc 把每一个文件的 resource 打开,再用 chiwizard 做出对照档。然后,开始比对吧。win98 大概有六七百 个符合的文件,花掉多少时间,您可以试做一个比对档来预估看看。 第一个 shell33.dll 的比对,由于没经验,三天。后来看习惯简体用词,比对 速度就快多了。 如果嫌不太够,还可以各加上 中文繁体版简体版的 office97 来比对。总之, 我看完了所有 win98 文件和部分 office97 文件的 resource,偶尔还得加上 ewin98 对照,唉,真变态,现在满脑子都是繁简 reource 在飞舞,作梦都要 梦到专有名词。实在不是人干的任务。 ■文化上的问题 这样做出来的东西,有没有比台擎内部的工具好,我不敢说。在自己中文化的 所有场合而言,已经够用,繁体中文化得再好,换成简体中文化就只能有七八 十分,但现在要提到九十五分,已经没有问题。弟有这样的自信。 专有名词的单纯替换,简单。如何在小小的宏内,把大陆的翻译语调,用词 方式,思考习惯放进宏 (虽然都是中文),取舍上并不容易。繁体转简体, 在用词上是多对一转换,没有太大问题,简体转繁体时,由于大陆的用词用语 也简化了,反转回繁体容易出现匹配不上的问题。这实在是文化上的问题,笔 者只能尽量依照自己的国文程度,在宏上做改进。虽然在弟这里测试已经没 有问题,但不能保证,转换后对照上下文会不会偏离或漏失原意? 所以,要提醒的是,简体反转回繁体时,一定要在 resource 上乖乖做调试任 务。这个工具你可以给与百分之九十八的信任,剩余的百分之二,还是要靠 自己。 ■ 版权声明 您可以免费使用,和任意修改它 (反正是文本文件,要改很简单,只是我再也找不 出可供对照的两岸计算机用语加进去了)。 如果你用了这个宏觉得好用,很爽快,想要感谢,就多做出一些简体中文化吧 。如您愿意,在简体作品说明的最后,提一下 Kxx 某人的宏,这样我就会很 暗爽了(笑)。 简体中文化,对 patch-author 来说,再也不是遥不可及的事了。