【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
为什么管理一严,员工就走人?
为什么好多人不承认大众审美就是喜欢白皮?
Rust 未来会成为主流的编程语言吗?
如何看待苹果在 WWDC25 发布的 Foundation 模型框架,它将为开发者和用户带来哪些改变?
为什么百度搜索引擎越做越差?
高德地图红绿灯读秒怎么实现的?
为什么说Mac编程是种享受?
为什么 Golang 不适合开发桌面系统?
有哪些事,是社会底层人认识不到的?
想买个鱼缸,听说里面坑很多,哪个大神给讲解一下呀?
电话:
座机:
邮箱:
地址: