• vB·流水帐

  • 生命不止,折腾不息。
  • 首页
  • 关于
  • 网址收藏
  • 登录
  • 密码泄漏搜索工具

    post by vibbow / 2012-3-17 22:09 Saturday

    呃... 因为搜索服务器出现了未知的问题(服务器显示在线,但是就是连不进去),所以我果断的选择了系统重建(发表此文时重建还未完成...),于是之前下载的一些数据库就all gone了。

    感觉自己也玩够了,PHP全文搜索的性能也优化到我满意的状态了,再加上同类的服务已经很多了,所以就放弃数据重建了,因此我的搜索工具理论上讲不会再上线了。如果你还需要进行搜索的话,可以用下面提供的这几个工具进行搜索,我相信对于绝大多数人来说,用户名搜索已经够用了,全文搜索仅仅是小众需求而已。

    工具  [1 (已牺牲)]  [2 (已牺牲)]  [3 (已牺牲)]  [4 (已牺牲)]  [5]  [6 (已牺牲)]  [7]  [8]  [9 (已牺牲)]  [10]  [11]

    稍后我将整理一下我的代码,加上一些注释,把我的算法发上来。如果你有兴趣与我进行PHP或者全文搜索方面的交流的话,可以给我发邮件或者加QQ进行讨论。

    我的邮箱:vibbow(at)gmail(dot)com (非GTalk)

    我的QQ:565837499 (请注明来源)

    最后再给某些人声明一下:1. 我没拿此服务盈利;2. 你也不是我的什么人。所以你也就没必要在我这里留言装大爷要数据库了,我也不会把数据库发给你的。

    ------ 分 割 线 ------

    搜索代码整理完成,直接下载放到PHP空间运行即可。

    因为要内存缓冲文本,因此请调大PHP的内存限制,同时对数据库文件进行切割。

    推荐设置PHP内存限制为1024MB,同时以200M为单位切割数据库文件。

    ------ 分 割 线 ------

    search2.zip 是第二版全文搜索代码,是根据 黑子 的代码重写出来的。

    速度更快,无需分割文件,缓存大小可以自己设置,推荐设置PHP的内存限制为缓存的4倍。

    呃... 不过懒得写注释了,大家将就着看吧...

    -- 2012/3/17日更新

    修正了search2.zip里的一个BUG:如果最后一行匹配的话会对当前文件重复搜索

    还有一点之前忘说了:源文件最后一定要有一行空行,否则最后一行就会被无视。

    附件下载:
    search.zip 1.95KB
    search2.zip 1.1KB
    « Weekly tweet log for 2012-03-19 | Nokia Lumia 800 吐槽文»

    评论:

    Louis Han
    2012-01-03 22:14
    靠 那么多工具都牺牲了
    回复
    miven
    2012-01-01 01:56
    测试不支持中文搜索。。
    太悲剧了。。。
    回复
    vibbow
    2012-01-01 02:24
    @miven:不是不支持,而是字符编码的问题。
    回复
    路人甲
    2011-12-30 10:19
    看下了,search.2.zip ,怎么没发现数据库连接语句啊
    回复
    vibbow
    2011-12-30 10:29
    @路人甲:直接搜索文本内容,不用数据库。
    用数据库的话就和算法基本没什么关系了...
    回复
    路人甲
    2011-12-30 12:26
    @vibbow:哦,刚仔细看了下,很不错啊
    回复
    黑子
    2011-12-30 04:37
    重写性能 在Xeon X5050上 0.5秒内完成对CSDN数据库的搜索
    你的1秒
    我重写的0.7秒
    回复
    黑子
    2011-12-30 04:37
    @黑子:https://www.pwleak.com/search.php
    回复
    vibbow
    2011-12-30 05:25
    @黑子:居然还有strrpos这个函数,以前没用过...
    用你的方法速度的确会快很多的。
    回复
    vibbow
    2011-12-30 08:11
    @黑子:根据你的算法,我又重写了一下我的。
    瓶颈已经从CPU转移到硬盘上了,无需分文件。
    10G数据170秒搜完,硬盘持续50M读,CPU占用13%(E5400)
    我再确认几遍没有问题了,整理下代码发上来。
    回复
    路人甲
    2011-12-30 15:19
    @vibbow:有10g的数据,我怎么才4G,我看你以前提供查询的时候,上面的库我都有呀
    回复
    vibbow
    2011-12-31 01:30
    @路人甲:后面又泄漏了N多啊。
    回复
    黑子
    2011-12-30 04:14
    看了一下代码
    file_get_contents后再explode完全是沒有必要的
    直接用file就可以按行导入
    回复
    vibbow
    2011-12-30 04:42
    @黑子:file函数耗内存太大,比file_get_contents + explode还要大。
    回复
    多啦AV梦
    2011-12-29 12:02
    在发一个 http://guobiao.me/geek/code/379
    回复
    vibbow
    2011-12-29 14:46
    @多啦AV梦:已添加
    回复
    黑子
    2011-12-28 02:38
    https://www.pwleak.com/
    回复
    vibbow
    2011-12-29 11:35
    @黑子:已添加
    回复
    chiceren
    2011-12-27 01:11
    猫1000W_8228.rar,虽然已经损坏,但是用Advanced RAR Repair还是可以恢复出一部分的。
    只是不知真假……
    回复
    passgod
    2011-12-26 20:38
    网传weibo的数据库是假的,全部是之前所传人人网的数据。
    回复
    vibbow
    2011-12-26 21:31
    @passgod:做技术的,无需关注他真假,只需提供对他的搜索就行了。
    回复
    Christopher Meng
    2011-12-26 18:12
    路过留名
    回复
    mmdagent
    2011-12-25 04:20
    泄漏密码查询,支持CSDN,嘟嘟牛,7K7K,人人以及178
    http://mmdagent.org/pwdsearch/pwdsearch.php
    回复
    vibbow
    2011-12-25 07:20
    @mmdagent:恩,已添加。
    回复
    thomas
    2011-12-23 09:59
    我刚才还发现了这个 http://www.zaifaguo.com/tools/csdn/
    回复
    vibbow
    2011-12-23 10:43
    @thomas:好的,已添加。
    回复
    取消回复

    发表评论:

  • 搜索

  • 随机日志

    • Weekly tweet log for 2011-12-05
    • 让PHPSay-Microblog调用自己架设的url压缩服务
    • IE9 pin 插件 for Emlog
    • Bing壁纸下载工具(PHP版)
    • Weekly tweet log for 2011-03-06
  • 最新评论

    • 小哲软件
      品牌機傷不起。。。
    • Louis Han
      都已经i7了 真羡慕啊
    • 伍颢
      试过过,不过还是不行呀,我把默认的模版和我使用的模版都改了,
    • 小笨。狼
      骂楼主的无非就是2种傻逼,1.狗屁不懂还把江东当圣人的废物。
    • vibbow
      很便宜,便宜的超乎你的想象。
  • 链接

    • HaCker-Fan's Blog
    • 快乐忆站
    • 流浪手记
    • zYhYtCn's Blog
    • 奇遇-心情随笔
    • 云端软件论坛
    • 造物虚生之人
    • CLURIES'
    • ss1271的奋斗
    • Dndx的温暖小窝
订阅Rss
Powered by emlog