博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Nutch 是一个开源Java 实现的搜索引擎
阅读量:4187 次
发布时间:2019-05-26

本文共 681 字,大约阅读时间需要 2 分钟。

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web。

 

 

Nutch的架构,采用了非常灵活的插件模式,大部分的核心功能,都可以通过组装插件的方式的来完成。如果想熟悉具体的nutch插件运行的机制,可以参考下nutch的官方wiki,今天散仙,主要来介绍下,怎么在nutch里,添加我们自己的插件。 

1,下载nutch编码,进行编译。
2,进入到nutch的根目录的src/plugin/下,新建一个index-self的文件夹,这个文件夹名字,可以随便起,散仙在这里,只是一个例子。
3,进入index-self文件夹下,新建\src\java\org\apache\nutch\myplugin\文件夹,存放自己的源码类
4,回到index-self根目录下,新建build.xml,ivy.xml,plugin.xml,这个是仿照其他的插件结构格式写的,如果不理解可以看下其他插件的结构
5,然后到src/plugin/的根目录下,修改build.xml注意路径
6,接下来,我需要修改nutch的根目录下的build.xml
7,当上面的所有都完成了,我们就可以进入到nutch的根目录下进行ant编译了,编译后我们可以在build/plugin/index-self目录下,找到编译后jar包和类文件。
8,最后一步,我们需要在nutch-default.xml里面,配置我们的插件生效.
9,上面的所有步骤,执行完,就完成了,我们在local或deploy模式运行,测试自己的插件是否被激活。

转载地址:http://jajoi.baihongyu.com/

你可能感兴趣的文章
当了将近十年的程序员,为什么从来没见过程序员带孩子
查看>>
程序员面试中最容易碰到的五个套路!应届生最容易上当
查看>>
三种不同的程序员,你属于哪一种?如果要裁员,你会让谁走?
查看>>
干货神总结,程序员面试技巧
查看>>
深度解析BAT三家互联网公司,为什么腾讯产品第一,百度技术第一,阿里运营第一?
查看>>
程序员发贴求助:剪短头发能缓解脱发吗?网友:我觉得秃头挺好的
查看>>
史上最难程序员的面试题!谷歌、百度、微软、阿里必答题
查看>>
为什么会出现“程序员千万不要学算法”这种言论?
查看>>
程序员如何做到快速升职?这几点你都做到了吗?
查看>>
第五届世界互联网大会重点介绍工业互联网
查看>>
凭什么程序员工资那么高?网友:某些文职坐着白领钱才让我惊奇
查看>>
程序员准时下班碰见领导,次月发工资时看到绩效莫名被扣20%
查看>>
你见过最牛逼的程序员是什么样的?拳打回车键,脚踩Emacs编辑器
查看>>
相比加班的程序员,企业更喜欢“偷懒”的程序员?程序员偷的不是懒,是高效!
查看>>
初学Java必备基础知识,编程领域你需要掌握的关键点!
查看>>
阿里五年Java程序员的总结,献给还在迷茫中的你!
查看>>
程序员身上有异味,同事为什么都不会直接告诉他?
查看>>
大数据折射算法“歧视”?王思聪微博抽奖113位,仅有一位男性
查看>>
Java、C、C+ +、PHP、Python分别用来开发什么?一篇文章告诉你!
查看>>
Linux-SHELL常用命令
查看>>