JAVA:Heritrix中扩展自己类的过程
来源:优易学  2011-2-21 10:45:08   【优易学:中国教育考试门户网】   资料下载   IT书店

  首先在Heritrix工程中创建类包my.processor.
  接着创建类FrontierScheduleHangD。
  详细代码:
  package my.processor;
  import java.util.logging.Logger;
  import org.archive.crawler.datamodel.CandidateURI;
  import org.archive.crawler.postprocessor.FrontierScheduler;
  public class FrontierScheduleHangD extends FrontierScheduler{
  final static Logger logger=Logger.getLogger(FrontierScheduleHangD.class.getName());
  public FrontierScheduleHangD(String name)
  {
  super(name);
  }
  protected void schedule(CandidateURI caUri)
  {
  String url=caUri.toString();
  if(url.endsWith(".jpg")
  ||url.endsWith(".gif")
  ||url.endsWith(".doc")
  ||url.endsWith(".html"))
  {
  return;
  }
  getController().getFrontier().schedule(caUri);
  }
  }
  接下来就是把自己的类加入到mudules选项中,如下如所示: 


  最后Add自己的Frontier。
  

责任编辑:小草

文章搜索:
 相关文章
热点资讯
资讯快报
热门课程培训