如何用java抓取百度Top500歌曲及源码下载
来源:优易学  2011-6-25 14:50:01   【优易学:中国教育考试门户网】   资料下载   IT书店

  在我整理完在线听歌(http://www.5a520.cn )的模块后,剩下来的工作就是如何通过程序抓取最新的Baidu好听的歌曲,抓取的工作主要包括3个属性:歌名、歌曲在线播放地址和歌词内容(符合LRC歌词格式),目前完成歌曲和歌曲地址抓取,由于百度的歌曲地址很多通过js获取,所以歌曲地址获取我这里使用搜狗音乐搜索方便些,所有的源码如下:
  package com.common.utils;
  import java.io.BufferedReader;
  import java.io.ByteArrayOutputStream;
  import java.io.IOException;
  import java.io.InputStream;
  import java.io.InputStreamReader;
  import java.io.OutputStreamWriter;
  import java.io.UnsupportedEncodingException;
  import java.net.HttpURLConnection;
  import java.net.MalformedURLException;
  import java.net.URL;
  import java.net.URLConnection;
  import java.net.URLDecoder;
  import java.net.URLEncoder;
  import java.util.ArrayList;
  import java.util.HashSet;
  import java.util.List;
  import java.util.Set;
  import java.util.TreeSet;
  import java.util.regex.Matcher;
  import java.util.regex.Pattern;
  import org.htmlparser.Node;
  import org.htmlparser.NodeFilter;
  import org.htmlparser.Parser;
  import org.htmlparser.filters.NodeClassFilter;
  import org.htmlparser.filters.OrFilter;
  import org.htmlparser.nodes.TextNode;
  import org.htmlparser.tags.LinkTag;
  import org.htmlparser.util.NodeList;
  import org.htmlparser.util.ParserException;
  import com.common.doc.FileOperUtils;
  class Song{
  private String name;
  private String url;
  private String lrc;
  public Song(String name,String url){
  this.name = name;
  this.url = url;
  this.lrc = "";
  }
  public String getName() {
  return name;
  }
  public void setName(String name) {
  this.name = name;
  }
  public String getUrl() {
  return url;
  }
  public void setUrl(String url) {
  this.url = url;
  }
  public String getLrc() {
  return lrc;
  }
  public void setLrc(String lrc) {
  this.lrc = lrc;
  }
  }

[1] [2] [3] 下一页

责任编辑:小草

文章搜索:
 相关文章
热点资讯
资讯快报
热门课程培训