01、近十万个
日常所使用的汉字只有几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字则已到99%,简体与繁体的统计结果相差不大。
汉字是世界上最古老的文字之一,至少有四千多年的历史,现存最早可识的成熟汉字系统是商代的甲骨文。汉字在形体上逐渐由图形变为笔画,象形变为象征,复杂变为简单;在造字原则上从表形、表意到形声。除极个别的例外,都是一个汉字一个音节。汉字是意音文字,一个汉字通常表示汉语里的一个词或一个语素,这就形成了音、形、义统一的特点。汉字是由笔画构成的方块状字,所以又叫方块字。
在汉字计算机编码标准中,最大的汉字编码是台湾地区的CNS11643,5.0版全字库可供查询的字共87,047个汉字、10771个拼音文字及894个符号。台港民间通用的大五码收录繁体汉字13053个。GB18030是中华人民共和国现时最新的内码字集,GBK收录汉字简体、繁体及20912个,而早期的GB2312收录简体汉字6763个。Unicode的中日朝(韩)统一表意文字基本字集则收录汉字20902个,总数亦高达七万多字。