大家都知道几乎每一个web应用或游戏设计中，都需要做敏感词的过滤以及转换。为了应对越来越多的敏感词，寻找一个高效率的敏感词过滤算法就摆在了各个程序员的面前。目前业内公认的效率最高的就是 DFA 算法。小编今天为大家分享这个开源项目也是基于DFA 算法实现：sensitive-word，用于过滤敏感词的 Java 库。一款高性能的敏感词过滤工具，词库共收录了 6w+ 内容，支持自定义敏感词、白名单、替换策略、数字常见形式的互换、忽略重复词等功能。该项目在 GitHub 上的star数更是一路飙升到了1.4k。

🌟 性能测试

1、测试环境为普通的笔记本

处理器 12th Gen Intel(R) Core(TM) i7-1260P 2.10 GHz
机带 RAM 16.0 GB (15.7 GB 可用)
系统类型 64 位操作系统, 基于 x64 的处理器

2、测试数据：100+ 字符串，循环 10W 次。

测试数据：100+ 字符串，循环 10W 次。不同环境会有差异，但是比例基本稳定。

🧰 如何使用

项目的使用非常简单快捷，具体步骤如下：1、环境依赖：

JDK1.7+
Maven 3.x+

2、在 pom 中引入依赖

<dependency> <groupId>com.github.houbb</groupId> <artifactId>sensitive-word</artifactId> <version>[最新版本]</version></dependency>

3、判断是否包含敏感词

final String text = "五星红旗迎风飘扬，毛主席的画像屹立在天安门前。";Assert.assertTrue(SensitiveWordHelper.contains(text));

版权声明 1 本网站名称：山海云端-专注于PHP与网络安全
2 本站永久网址：www.shserve.cn
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 QQ1790643379进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END