java的http断点续传原理(一)-Java认证考试网-优易学

java的http断点续传原理(一)

来源：优易学 2011-12-11 17:08:36 【优易学：中国教育考试门户网】资料下载 IT书店

　　(一)断点续传的原理

　　其实断点续传的原理很简单，就是在Http的请求上和一般的下载有所不同而已。

　　打个比方，浏览器请求服务器上的一个文时，所发出的请求如下：

　　假设服务器域名为wwww.sjtu.edu.cn，文件名为down.zip。

　　GET /down.zip HTTP/1.1

　　Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-

　　excel, application/msword, application/vnd.ms-powerpoint, */*

　　Accept-Language: zh-cn

　　Accept-Encoding: gzip, deflate

　　User-Agent: Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)

　　Connection: Keep-Alive

　　服务器收到请求后，按要求寻找请求的文件，提取文件的信息，然后返回给浏览器，返回信息如下：

　　200

　　Content-Length=106786028

　　Accept-Ranges=bytes

　　Date=Mon, 30 Apr 2001 12:56:11 GMT

　　ETag=W/"02ca57e173c11:95b"

　　Content-Type=application/octet-stream

　　Server=Microsoft-IIS/5.0

　　Last-Modified=Mon, 30 Apr 2001 12:56:11 GMT

　　所谓断点续传，也就是要从文件已经下载的地方开始继续下载。所以在客户端浏览器传给

　　Web服务器的时候要多加一条信息--从哪里开始。

　　下面是用自己编的一个"浏览器"来传递请求信息给Web服务器，要求从2000070字节开始。

　　GET /down.zip HTTP/1.0

　　User-Agent: NetFox

　　RANGE: bytes=2000070-

　　Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2

　　仔细看一下就会发现多了一行RANGE: bytes=2000070-

　　这一行的意思就是告诉服务器down.zip这个文件从2000070字节开始传，前面的字节不用传了。

　　服务器收到这个请求以后，返回的信息如下：

　　206

　　Content-Length=106786028

　　Content-Range=bytes 2000070-106786027/106786028

　　Date=Mon, 30 Apr 2001 12:55:20 GMT

　　ETag=W/"02ca57e173c11:95b"

　　Content-Type=application/octet-stream

　　Server=Microsoft-IIS/5.0

　　Last-Modified=Mon, 30 Apr 2001 12:55:20 GMT

　　和前面服务器返回的信息比较一下，就会发现增加了一行：

　　Content-Range=bytes 2000070-106786027/106786028

　　返回的代码也改为206了，而不再是200了。

　　知道了以上原理，就可以进行断点续传的编程了。

　　(二)Java实现断点续传的关键几点

　　(1)用什么方法实现提交RANGE: bytes=2000070-。

　　当然用最原始的Socket是肯定能完成的，不过那样太费事了，其实Java的net包中提供了这种功能。代码如下：

　　URL url = new URL("http://www.sjtu.edu.cn/down.zip");

　　HttpURLConnection httpConnection = (HttpURLConnection)url.openConnection

　　();

　　//设置User-Agent

　　httpConnection.setRequestProperty("User-Agent","NetFox");

　　//设置断点续传的开始位置

　　httpConnection.setRequestProperty("RANGE","bytes=2000070");

　　//获得输入流

　　InputStream input = httpConnection.getInputStream();

　　从输入流中取出的字节流就是down.zip文件从2000070开始的字节流。

　　大家看，其实断点续传用Java实现起来还是很简单的吧。

　　接下来要做的事就是怎么保存获得的流到文件中去了。

　　保存文件采用的方法。

　　我采用的是IO包中的RandAccessFile类。

　　操作相当简单，假设从2000070处开始保存文件，代码如下：

　　RandomAccess oSavedFile = new RandomAccessFile("down.zip","rw");

　　long nPos = 2000070;

　　//定位文件指针到nPos位置

　　oSavedFile.seek(nPos);

　　byte[] b = new byte[1024];

　　int nRead;

　　//从输入流中读入字节流，然后写到文件中

　　while((nRead=input.read(b,0,1024)) > 0)

　　{

　　oSavedFile.write(b,0,nRead);

　　}

　　怎么样，也很简单吧。

　　接下来要做的就是整合成一个完整的程序了。包括一系列的线程控制等等。

　　(三)断点续传内核的实现

　　主要用了6个类，包括一个测试类。

　　SiteFileFetch.java负责整个文件的抓取，控制内部线程(FileSplitterFetch类)。

　　FileSplitterFetch.java负责部分文件的抓取。

　　FileAccess.java负责文件的存储。

　　SiteInfoBean.java要抓取的文件的信息，如文件保存的目录，名字，抓取文件的URL等。

　　Utility.java工具类，放一些简单的方法。

　　TestMethod.java测试类。

　　下面是源程序：

　　**SiteFileFetch.java

　　package NetFox;

　　import java.io.*;

　　import java.net.*;

　　public class SiteFileFetch extends Thread {

　　SiteInfoBean siteInfoBean = null; //文件信息Bean

　　long[] nStartPos; //开始位置

　　long[] nEndPos; //结束位置

　　FileSplitterFetch[] fileSplitterFetch; //子线程对象

　　long nFileLength; //文件长度

　　boolean bFirst = true; //是否第一次取文件

　　boolean bStop = false; //停止标志

[1] [2] 下一页

责任编辑：小草

上一个文章： JDBC获取新增记录的自增主键
下一个文章： java的http断点续传原理(二)

Java每5秒生成一个随机数
Java克隆(clone)方法的使用
PING和TELNET用法介绍
Java7准备让函数方法成为一等公民
JVM处理Java数组方法的思考
java如何通过googlemapapi实现地址解析
java表格组建的使用

热点资讯

资讯快报

热门课程培训

论坛新帖