首页  >   数字伙伴计划

关注数字时代的“生僻字之困”,上海“数字伙伴计划”携手支付宝开展专题交流活动

随着数字化浪潮来袭,生僻字姓名用户在享受本应便利的在线服务时费尽周折,成为困在数字时代各类信息系统“盲区”中的“弱势群体”。在上海市经济和信息化委员会指导下,6月16日,上海智慧城市发展研究院携手支付宝(中国)网络技术有限公司,开展数字伙伴计划“弥合生僻字姓名人群数字鸿沟”专题活动,邀请相关政务单位、科研院所,以及来自金融、通讯等服务机构的专家和生僻字用户代表,围绕生僻字在信息系统中的政策、技术、实践等话题深入探讨交流,力争构建该项工作在本市的合作生态,助力推动生僻字姓名人群无障碍享受数字服务。

支付宝副总经理封俏代表本次活动主办方,对相关领域嘉宾的到来表示欢迎。期待以此活动为开端和契机,从行业侧发力,推动更多合作单位一起探索生僻字数字化难题的解决路径。

1687250494798763.jpg

上海市经济和信息化委员会信推处石宇在讲话中介绍了上海信息系统生僻字问题改造工作的开展情况。根据市人社局的统计,本市1400多万社保金用户中8000名左右市民姓名中含有乱码。由此推算,上海2500万常住人口中包含生僻字姓名的市民约在1.5万人左右。2021年9月,市经信委和市大数据中心联合印发《关于开展信息系统生僻字问题改造的通知》,启动改造一期工作,主要围绕“一网通办”和就医挂号两大重点领域展开,由市大数据中心将生僻字接入电子政务云PASS层服务内容,通过市电子政务外网为各委办局、各区、各医疗机构提供生僻字调用接口服务,目前已累计接入84个系统。

“路虽远行则将至”,石宇在讲话最后作出期许,鼓励各类机构积极投入到这项工作中来,以点滴进步汇聚更大成功。

1687250575863631.jpg

中国科学院软件研究所高级工程师刘汇丹基于多年生僻字信息化研究经验,从生僻字在数字时代的使用困境、技术需求、国标行标推进等方面进行了分享。刘博士谈及,“生僻字”在不同场景下的内涵有差异,但总体上估算,全国姓名中有生僻字的群体规模确实不小,他们无法顺利享受数字化时代的便利。汉字编码字符集有一个逐渐扩大动态变化的过程,目前最新国际标准收录汉字数量已达到9.7万多字。但据估计社会生活中实际在用的汉字数量在3万至4万之间。一方面很多实际在用的生僻字没有被通用输入法和字库收录,另一方面,国家编码字符集标准中收录了大量的用不到的繁体字、异体字。

导致当前生僻字问题的主要原因有三个,其一是各机构曾经用自造字的方式努力解决生僻字问题,在当时成功解决生僻字的显示和打印问题,但在当前要求数据互联互通的背景下,互不兼容的自造字却成为解决问题的障碍。其二是大量信息系统仍然在使用GBK编码字符集,会将生僻字转码为问号。GBK已经于2000年被GB18030取代,不应再使用。其三是很多Web应用使用JS代码限定了只认20902个汉字,不认生僻字。

在弥合生僻字“数字鸿沟”方面,从国家层面到各行各业正大力推动,未来可期。今年8月即将正式实施的GB18030-2022国家标准收录汉字及部首88115个,为姓名生僻字人群用字需求提供强有力的标准保障;金融服务领域,中国人民银行直面生僻字问题进行行业标准制定,为其他行业树立了标杆;上海市全市统筹解决生僻字问题,为其他省市树立了标杆。

中国科学院软件研究所在汉字信息处理方面有很多年的技术积累,曾经在国家“十一五规划”新闻出版重大科技工程“中华字库”工程中解决了110万量级汉字编码字符集的基础应用支撑问题。软件所参与发起的PUACleaner项目于近期上线,为各机构将历史数据从PUA编码标准化为国标正式码提供技术支撑。软件所与北京卓玛之裕科技有限公司联合研发的“卓码生僻字解决方案”在技术处理方面有明显的优势,并且已经在国内多家权威机构得到应用,为各机构解决生僻字问题提供了一个新的选项。

1687250660398954.jpg

针对生僻字数字化现状,蚂蚁集团进一步开源自研的生僻字解决方案,发布启动“汉字拾光计划”,向全社会免费开放,以帮助有需要的公共服务机构和企业以更低成本实现生僻字改造。支付宝技术专家胡义兵在会上详细分享了“汉字拾光计划”的方案设计及实际成效。

该方案完整解决了生僻字从输入、显示到互通互认各个环节的问题——在输入方面,方案提供多样化输入模式、适配多端的生僻字输入组件;在显示方面,蚂蚁集团与阿里巴巴普惠体合作重新设计汉字字体,通过向目标用户推送消息下载或者主动触发下载的方式,在支付宝APP端加载该字体从而解决了显示问题;在系统间互通互认方面,基于蚂蚁自研的多编码映射字库,提供了各类关键生僻字姓名服务,帮助生僻字姓名在系统间互通互认。

据悉,该解决方案在去年已经在支付宝得到应用,用户通过生僻字键盘只需要像正常打字一样输入拼音,即可打出对应的生僻字,成功解决生僻字用户难以通过实名认证、绑卡、刷脸等困境。

1687250696788923.jpg

中国银联资深高级工程师缪海波聚焦金融业分享生僻字数字化实践与应用经验。缪海波从金融业生僻字输入、显示、信息交换、存储和内部处理5大问题业务表现和对应成因分析切入,一一分享生僻字问题的治理改造经验。如,信息系统对外接口字符集的编码兼容性改造方案、系统内部的生僻字处理方案、后台数据库字符集升级的方案以及生僻字输入方案的对比等。

缪海波提出期许,金融业生僻字“数字鸿沟”的彻底解决,不仅需要机构自身工作的持续深入,更需要相关社团组织、金融机构、产业机构间协同合作,合力为生僻字人群创造便捷有温度的金融服务环境。 

1687250724724184.jpg

主题分享后,与会嘉宾还共同围绕各自领域业务实际,交流生僻字数字化难点堵点,交换经验方案。改变往往不会一蹴而就,生僻字问题相关主体众多、涉及环节复杂,需要多方参与、凝聚合力,助力弥合生僻字“数字鸿沟”!

1687250770121378.jpg

网址:www.sscdi.cn

地址:上海市浦东新区源深路38弄富源置地广场2号楼4楼

电话:021-50599810

邮箱:info@sscdi.cn

关于我们

关注我们

微信公众号

智慧城市观察

新产研中心

数字城市云课堂

  Copyright © 2021 上海智慧城市发展研究院 版权所有 沪ICP备17004664号-2 >> 网站建设·骐翔网络  <<