1. XenForo 1.5.14 中文版——支持中文搜索!现已发布!查看详情
  2. Xenforo 爱好者讨论群:215909318 XenForo专区

口字旁的当怎么打不出来了?

本帖由 漂亮的石头2020-09-16 发布。版面名称:知乎日报

  1. 漂亮的石头

    漂亮的石头 版主 管理成员

    注册:
    2012-02-10
    帖子:
    485,110
    赞:
    46
    [​IMG] Kushim Jiang,前一级字典翻找员,现二级切字工。 阅读原文

    「⿰口当」的源流梳理起来相当简单。稍微介绍一番。

    一、分化与简化

    「當」一直有用作象声词的例子,如:

    [宋]陳師道《黄樓絶句》:「樓上當當徹夜聲,與人何事有枯榮。」任淵注:「當當,塌碑聲。」​

    作为象声词的「當」此后添「口」分化作「噹」,用作形容玉、石、金属等材质的器物撞击的声音。如:

    《西遊記》第七十回:「行者聞説,將金杯連酒望空一撇,噹的一聲響亮,那个金杯落地。」
    [清]洪昇《長生殿・重圓》:「仙珮互趨蹌,趁天風,惟聞遥送叮噹。」​

    同时期,在俗字文本中「當」已有写作「当」的例子,如《宋元以來俗字譜》引《京本通俗小說》(元)、《目連記》、《金瓶梅》和《嶺南逸事》(清),「當」均写作「当」。

    因此,在此后的历次简化方案中,「當」形均简化作「当」,同理「噹」亦简化作「⿰口当」。此后,二者合并,「⿰口当」中象声词的义项回归于「当」。

    [​IMG]
    《第一批简体字表》,1935 年 8 月 22 日。
    [​IMG]
    《798 个汉字简化表草案》,1955 年 1 月。
    [​IMG]
    《汉字简化方案》,1956 年 2 月。
    [​IMG]
    《简化字总表》,1964 年 5 月。

    二、铅印与照排

    中国的第一次微机热被认为出现于 1984 年,所以拿出一本六七十年代的书籍问「他们如何打出来的?」问题总是听起来相当滑稽。

    当书面文本的印刷处在铅排时代时,每个字的样式由刻成的铜模决定。不断浇铸铜模可以批量生产铅字,然后通过排版印刷得到书面文本。如果遇到字盘中没有的字,也没有对应的铜模可以铸得,则需要用手工刻制铅字。因而早期出版物上印刷得到的字是刻成的。

    [​IMG]
    未名. 「半壶响叮⿰口当」[J]. 山花, 1958 (03): 6.

    到照排时代时,生僻字的处理则交由补字软件和造字软件实现。例如「女娲补字软件」,包含点阵编辑方式和向量编辑方式,在拼完后输入私用的字符集码位将转换得到的点阵信息存盘。

    顺带一提,@夙浅 文中的截图来自商务印书馆的《新华词典》。

    [​IMG]
    《新华词典》(第四版),商务印书馆,2013-08

    三、编码与伪编码

    由于《简化字总表》中「噹」和「當」合并为「当」,在七四八工程中进行的字频统计里自然只会有「当」的字频,加上《简化字总表》使得 GB/T 2312-1980 中不会出现「⿰口当」字。又由于这是个简化字,所以其它国家和地区也不会提交这个字,从而 URO 中不会有这个字。

    「⿰口当」这个字被收入 Unicode,或者说 ISO/IEC 10646,或者说 GB/T 13000,是在扩充 C 块内。由于当时对每个被提交的汉字有了「讲证据」的要求,中国方面对所有用字大头提交来的汉字进行审查,并筛选出有证据的汉字加以提交,其中就包括「⿰口当」字。

    @BadVortex 恶漩 误以为「GBK-2001.87」里的「GBK」是那份《汉字内码扩展方案》,其实不然。耐心查看 UAX #38 就能发现,「G」来自「国标」,指代中国的需求(也包括新加坡,不提),而「BK」的含义实际是《中国大百科全书》。具体的提交文件,如同引文所述的,来自 IRG N1227。

    为何「⿰口当」(U+2A83D)会被 Unicode 收录?

    接下来需要解释臭名昭著的「腾讯 - 搜狗自造字库」。

    简单来说,QQ 拼音输入法和搜狗输入法可能需要兼容 Windows XP 系统,该系统对 BMP 以外字符的支持很烂,其系统也不内置显示 SIP 汉字的字体文件,因此这两个输入法可能不会选择将字符映射到合法的 SIP 平面上。这可能是两个输入法盯上不合规矩的私用区(Private Use Area)的原因。

    Windows 操作系统的上古时代有一款名为「EUDC Edit」的应用,「EUDC」是「end user defined character」(由端用户定义的字符)的意思,实际是一个将点阵图案造在私用区上的软件。

    于是,QQ 拼音输入法造了 413 个字,搜狗输入法接着在后面造了 2 个字,并建立了输入方法。如今安装这两个输入法的最新版本,仍然会默认安装一个由他俩自造的字体(自然是相当丑陋的)。将这种行为解释为向后兼容是可以的,但是也没见着他们将其映射到合规的码位上,看来是不打算前进了。

    搜狗自造字为什么用非标准码,造了哪些字在哪里能查出来?

    四、现实

    所谓「私用区」,是 UCS 建立初期由于字体技术尚未发展,每个字符造型需要对应上字符集码位,所引致的区块。用户定义自己需要的字符及其造型,并在自己实现的封闭系统中使用。这也是用 QQ 拼音输入法和搜狗输入法打出来而没法搜索的原因,因为它们是「私用」的。

    至于标准的码位,也是许多答主提到的 U+2A83D 为何在知乎回答中无法显示,其所牵涉的则是一个至少 4 年前就已经被注意而一直未被推动的需求。

    为什么知乎不支持 non-BMP 的汉字?

    当然,即使是支持非 BMP 字符的评论区和专栏,也因为其屡次「升级」而变得与不支持无异。

    知乎允许使用 Unicode 非 BMP 字符提问吗 ?

    综上,「『⿰口当』打不出来」这一问题,在表层的曼德拉效应之下,是简化草案的惯性、口部拟声词的潜意识、落后输入法对新标准毫不跟进、落后网站对潜在需求毫不推动所共同引致的现象。

    因此,@夙浅@caruce 所提到的「字库删除」说自然是明显错误的,因为在大众的视野中,它们从未合规地出现过。

    以上。

    阅读原文
     
正在加载...