2023 第 5 期

 

感谢Wey Gu 赠给我们的 nebula 小抱枕和 T-shirt,欢迎进群抽奖(群号详见北邮bbs论坛)

读一读

基于 CNN 的新词发现算法

链接

  • Tag: #NLP
  • 作者:携程技术
  • 引言:本文源自携程技术,本文的作者是携程的高级研发,负责自然语言处理领域技术。 随着消费热点和网红新梗的不断涌现,电商平台的NLP任务经常出现以往未见的词汇,这些词汇未被系统词库收录,被称为”未登录词”。”未登录词”影响了基于词库的分词器的分词质量,新词发现算法是解决此类问题的关键。为解决传统算法中需要随着语料变化不断不断调参的局限性,作者参考图像分割算法,采用FCN来进行新词发现。 一方面,词库中的缺失影响了基于词库的分词器的分词质量,进而间接影响了文本召回质量和高亮提示的效果。这也就影响了用户文本搜索的准确性和搜索结果的可解释性。 另一方面,在主流的NLP深度学习算法BERT/Transformer等中,对中文的处理通常使用字向量代替词向量。从理论上讲,使用词向量效果更佳,然而在实践中,由于未登录词的存在,使用字向量的效果更好。如果词库更加完善,使用词向量将优于使用字向量。 基于此,本文作者设计了一套新词发现算法。

携程 MySQL 迁移 OceanBase 最佳实践

链接

  • Tag: #数据库迁移
  • 作者:携程技术
  • 引言:本文源自携程技术。提挈,携程资深数据库工程师,专注于数据库自动化运维和分布式数据库的研究。Cong,携程数据库专家,主要负责MySQL和分布式数据库运维及研究。Typhoon,携程高级数据库工程师,负责分布式数据库的运维和工具设计。 半月刊的上一期(第四期)提到了数据库的“革命”,这一期小编收录了携程团队迁移 MySQL 至 OceanBase 的技术实践记录,以飨读者。本文详细阐述了实际开发数据库迁移过程中遇到的问题和 OceanDB 的解决方案。

浅谈前后端路由与前后端渲染

浅谈前后端路由与前后端渲染 | MARKSZのBlog

  • Tag: #前端
  • 作者:MARKSZ
  • 引言:本文适合前端新手阅读。本文详细讲解了前端中的“路由”(Router)这一概念,以及 Vue、React-Router 框架中路由组件的根本逻辑。从路由出发,作者又介绍了单页面应用与服务端渲染的区别,简单介绍了 SSR 技术的现状。

Can Rust Beat JavaScript in 2023?

Is Rust a worthy contender for web development?

  • Tag: #Rust
  • 作者:Josh Mo
  • 引言:本文是英文博客。 WASM 技术看起来似乎已经越发成熟,后端开发者也越来越倾向于使用 Rust 来进行后端开发。Rust 会取代 JavaScript 成为 Web 开发技术的弄潮儿吗?这一篇文章给了肯定的回答。

小编正在寻求你的帮助! 我们决定未来搬运更多的英文博客。如果您看到了好的英文博客,希望您可以联系小编(angrychow@bupt.edu.cn)。


If you like xLens.Space, don’t forget to give me a star. :star2:

Star This Project