【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
我国其实现在需要一个国有企业在国外挖一个大坑,然后这个国有企...
2023年十月的聊天记录 ,我去外面和朋友玩,他一直在微信和...
是时候祭出大杀器了: 移动用户:使用本机编辑短信“CXXZ#...
第一,朝鲜就认一个死理:你打我,我就打韩国,而且是往死里打。...
听说过chatgpt吗 你让他给你写个前端页面看看,写的贼溜...
我用自然码七八年了,去年听一个做书记员培训的人说自然码和小鹤...