一月
1.
上线三套流量隔离的K8S集群
通过引入服务流量隔离的三套K8S集群,并且可以自由方便在三套集群间切换服务流量配比。
通过这套方案可以实现小流量线上测试、部分集群流量异常后快速切除,分集群升级重大服务或者底层组件。极大的提升来也核心Saas产品”吾来“的SLA。
二月
1.
"吾来“支持英文问答
在Quora的问答评测集合准确率达到了85.2%,达到SOTA水平
2.
整体升级了监控系统
重构了来也Saas的整体监控系统,升级了监控面板,将所有的监控指标统一维护。此次改造除了原本所有的grpc和http微服务的监控、容器和宿主机的监控外;还增加各种中间件的监控和报警,如消息队列的堆积监控报警,redis的key数量波动率监控报警等;并且所有的监控指标在一个系统并对所有研发可见,提高了大家查询问题效率
三月
1.
句向量召回提供服务
在”吾来“产品用户无感知的情况下我们上线了句向量召回系统。在前期长达半年的时间里,我们尝试多种句向量编码算法和句向量检索引擎,上线的句向量召回系统可以减少对语料的数量要求,并且比较有效增强了召回的泛化能力,而在机器人回复延时和机器人搭建体验上无任何受损。
2.
自研通用OCR上线
通过引入Transformer、各种CV中的Attention、基于超分辨率重建的多任务训练等技术,在文档类测试集合图片上,自研OCR识别准确率超过百度高精。
四月
1.
自研的自动化测试系统Siber和CI无缝集成
在研发同学提交PR后,会触发自动镜像构建、服务的自动部署,部署成功后会自动通知Siber运行Grpc、Http、GraphQL等接口的自动化测试用例,提高了测试效率和研发交付质量
2.
Grpc-Web在正式项目中全面启用
在来也新的产品“UiBot-Mage" 正式使用Grpc-Web技术,前端WebUI和后端服务直接通过Grpc通信传输,取代了以前的前端UI->GraphQL→Grpc服务的模式,去掉GraphQL的开发工作,提高研发效率,也避免了引入GraphQL带来的Bug。
五月
1.
大规模预训练资源问答模型上线
在F1指标不变的前提下,将语料的规模降低了一半,有效的降低搭建和运营对话机器人的成本
2.
自研的BI平台开始提供服务
BI平台上线取代了以前工程师写代码统计各种指标浪费人力的历史,在绝大多数的统计指标上,只需要应用按照约定记录日志,后续的日志传输,清洗,加载归档等ETL工作完全无需工程师参与,在最终的指标产出也只需一条SQL,就可以产出各种可视化的报表等。
3.
UiBot-Commander上云
UiBot-Commander全面上云,并且部署了多套集群,达到开箱即用的目的。
六月
1.
数据变更平台提供服务
在对话机器人产品“吾来”中,为了减少机器人回复延迟,一些核心的元数据(存储于关系数据库)需要近实时加载到内存,在数据变更平台上线前业务方会采用定时扫描表等策略,造成了代码冗余以及对关系数据库产生较大的压力,通过数据变更平台可以将关系数据库改动的数据近实时投递给业务方,减缓了上述缺点。
七月
1.
“吾来”获取信通院对话系统最高等级认证
“吾来”对话机器人平台获得中国人工智能产业发展联盟和中国信息通信研究院智能对话系统最高等级认证.
2.
K8S的CPU资源弹性伸缩上线
根据业务量、服务器的监控信息等Metric,以及一些其他外部指标如时间,在“吾来”产品线上实现动态购买阿里云资源并加入K8S集群,提供线上服务,有效的压低ECS等资源闲置带来的浪费。
八月
1.
ChatOps落地
基于ChatOps+Prow ,搭配来也内部的CI流程,进一步的提升了研发效率
九月
1.
基于Serverless 的性能压测平台提供服务
自研标准的性能压测平台有效的缓解了内部服务在压测环节上准备工作,基于Serverless,在无压测任务时可以释放服务器资源减少成本,并且可以根据压测的并发量动态的申购云资源。
十月
1.
“疫情政务问答助手”技术挑战赛获取第一名
参加北京经信局和中国计算机学会主办的“疫情政务问答助手”技术挑战赛,获得第一名。
2.
OCR国产化适配成功
通过前期的努力和准备,自研的通用识别OCR全面适配了国产麒麟操作系统和飞腾CPU,并且在正式项目中提供服务
3.
K8S的GPU资源弹性伸缩上线
通过监控GPU的Metric,在深度学习的模型inference服务上实现了GPU资源的弹性购买并加入服务集群,当用量降低后再无损业务的摘除和释放资源,节省了GPU的服务费用
11月
1.
私有部署自动化平台提供服务
在一个季度的研发后,在来也的核心私有部署产品UiBot-Commander和UiBot-Mage可以实现一站式的:申请、审批、自动生成授权文件、按需生成自动化部署程序等功能,有效的缓解私有部署的复杂度
2.
知识图谱驱动多轮对话机器人上线
由税务强领域知识图谱驱动的多轮对话机器人正式服务某客户
3.
安全测试例行化
在这个月实现代码的静态安全扫描(xss,sql注入,csp,敏感字符),和利用第三方的安全扫描工具(绿盟和阿里云霹雳)进行例行的安全检查,为客户提供高安全的服务和产品
4.
可加密模型的TF-Serving开源
此工具可以有效的避免私有部署场景里的模型的安全性,避免模型被盗取:https://github.com/Laiye-Tech/serving
12月
1.
“强芯健魂、铸基智能”获取第二名
参加某部委主办的“强芯健魂、铸基智能”智能计算基础平台挑战赛,智能软件组军事文本实体关系抽取任务,获得二等奖
2.
高保真OCR训练合成工具提供服务
缺乏大量真实训练数据是制约基于深度学习OCR的发展的瓶颈之一,特别是一些难以获取的数据上如身份证上更为明显,通过这套合成工具只需要提供底板和文字的描述信息,可以快速大量的合成训练数据,如下图是只提供身份证底板和身份证上文字的描述信息,后合成身份证图片样例:
3.
基于Knative的深度学习模型提供服务
来也的UiBot-Mage集成多家合作伙伴的几十个OCR模型,利用Knative方式部署模型,可以让一些冷门场景的模型如结婚证识别,在不使用时不占用显卡,极大的降低了对GPU显卡的需求量