【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
举例黒神话: 官方推荐用手柄,老外主播、国内非专业主播都用手...
结构化搜索与替换(Structural Search and...
“Kubernetes 并不会主动摧毁你的服务,但它会在你没...
记住,如果双方发生***,且对方酒驾的情况下,正确做法是直接...
1 见过发短***维权的,也见过发短***擦边的。 这是第...
因为全球经济体系中,少了分解者这一环,这点你看自然界就知道了...