關鍵詞過濾
关键词过滤,也稱關鍵字過濾,指网络应用中,对传输进行预先的程序过滤、嗅探指定的关键字词,并进行智能识别,检查网络中是否有违反指定策略的行为。类似于入侵检测系统的过滤管理,这种过滤机制是主动的,通常对包含关键词的信息进行阻断连接、取消或延后显示、替换、人工干预等处理。
系列條目 |
审查制度 |
---|
关键词过滤的主要布置在路由器、应用服务器、终端软件上,对应的应用场合主要有网络访问、论坛、网志、即时通讯、电子邮件等。
终端软件关键词过滤
网络应用软件自身附带关键词列表,对指定关键词进行处理。
QQ(包括QQ游戏)、VeryCD公司基于官方eMule修改的eMule VeryCD Mod和EasyMule(官方eMule中无关键字词过滤)、TOM-Skype等中国大陸网络软件中,被很多使用这些软件的网友发现有内容几乎相同的关键字词过滤文件。
在2006年,黑客发现 eMule VeryCD Mod 有一个关键词过滤文件。[1]
同年,有中国大陸黑客发现QQ有一套过滤词汇表,是QQ游戏目录下的COMToolKit.dll,[2][3]过滤词汇内容与eMule VeryCD Mod的关键词过滤文件内容几乎相同。[3]这套过滤程序收录了1041个词汇,与性相关的约占15%,其余基本都是与政治相关。[4]由于中国大陸网络审查缺乏对公众透明,这个关键词过滤文件是否是由中国大陸的网络警察创作的,目前没有明确的说法。
并且,为了某些安全上面的需要,某些网页游戏(flash编写)中有一部分资源文件亦有使用as脚本编写的敏感词过滤文件(扩展名为swf),不过必须使用专门的软件对其进行反向工程才可以查看包含的敏感词。
影响
斯肯索普问题,指的是整句字词里含有部分字符子串含有敏感字符(如“开放性交互式编辑界面”一词含有“性交”一词),从而被网站關鍵詞過濾。英国小镇斯肯索普 (Scunthorpe) 含有英文字词 "cunt" (阴道、“屄”),1996年,当地居民称无法从美国在线注册,因故得名“斯肯索普问题”。
参見
参考文献
- 位于其目录下的审查字符文件
- The words you never see in Chinese cyberspace :: China Digital Times 的存檔,存档日期2008-01-09.
- 中共非法过滤QQ词列表大起底 的存檔,存档日期2010-07-17.
- 热点:大陆一千零四十一个被禁止的网络词汇--何山 的存檔,存档日期2005-11-12.