相关动态
baidu.rar_baidu_baidu api_搜索引擎api_百度搜索api_百度的API
2024-11-10 18:20
import java.io.BufferedInputStream;

baidu.rar_baidu_baidu api_搜索引擎api_百度搜索api_百度的API

import java.io.BufferedReader; import java.io.File; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.MalformedURLException; import java.net.URL; import java.net.URLConnection; import java.net.URLEncoder; import java.util.ArrayList; import java.util.Iterator; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; import org.apache.commons.httpclient.*; import org.apache.commons.httpclient.methods.GetMethod; import org.apache.commons.httpclient.methods.PostMethod; import org.apache.commons.httpclient.params.HttpClientParams; import org.apache.commons.httpclient.params.HttpMethodParams; import org.jsoup.Jsoup; import org.jsoup.nodes.document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class BatchDownload { public static void main(String[] args) { //百度图片 String fromUrl = "http://image.baidu.com/i?tn=baiduimage&ct=201326592&cl=2&lm=-1&fr=&fmq=&pv=&ic=0&z=&se=1&showtab=0&fb=0&width=&height=&face=0&istype=2&word=%B3%B5&s=0"; StringBuffer pageContents = new StringBuffer(); //System.out.println("asdasdas"); try{ URL startUrl = new URL(fromUrl); pageContents = downloadPage(startUrl); //System.out.println(pageContents); // if(pageContents.length()==0) System.out.println("asdasdas"); List<String> imgUrls = getImageUrls(pageContents); //System.out.println(imgUrls.size()); //downloadImages(pageContents); //if(pageContents.length()==0) System.out.println("asdasdas"); //System.out.println(pageContents); } catch(Exception e) { } } public static StringBuffer downloadPage(URL httpUrl)throws MalformedURLException,IOException { StringBuffer data = new StringBuffer(); String currentLine; // 打开输入流 BufferedReader reader = new BufferedReader(new InputStreamReader(getInputStream(httpUrl), "GBK")); // 读取数据 while ((currentLine = reader.readLine()) != null) { data.append(currentLine); } reader.close(); return data; } public static File downloadFile(String httpUrl, String fileSavePath)throws MalformedURLException, IOException { File file = new File(fileSavePath); if (!file.exists()) { file.createNewFile(); } URL url = new URL(httpUrl); // 打开输入流 BufferedInputStream in = new BufferedInputStream( getInputStream(url)); // 打开输出流 FileOutputStream out = new FileOutputStream(file); byte[] buff = new byte[1]; // 读取数据 while (in.read(buff) > 0) { out.write(buff); } out.flush(); out.close(); in.close(); return file; } private static void downloadImages(StringBuffer pageContents)throws MalformedURLException, IOException { // 获取html页面 StringBuffer page = pageContents; // 获取页面中的地址 List<String> imgUrls = getImageUrls(page); // 保存图片,返回文件列表 List<File> fileList = new ArrayList<File>(); String imgSaveDir="E:"; int i = 1; for (String url : imgUrls) { String fileName = url.substring(url.lastIndexOf("/") + 1); File file = downloadFile(url, imgSaveDir + "\" + fileName); System.out.println(file.getPath()+ " 下载完成!"); fileList.add(file); i++; } } private static InputStream getInputStream(URL httpUrl) throws IOException { // 网页Url URL url = httpUrl; URLConnection uc = url.openConnection(); uc.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)"); return uc.getInputStream(); } public static List<String> getImageUrls(StringBuffer html) { List<String> result = new ArrayList<String>(); // 将字符串解析为html文档 document doc = Jsoup.parse(html.toString()); // 获取img标签 Elements es =doc.getElementsByTag("img"); //Element es = doc.getElementById("script"); //Elements ss = new Elements(); //ss.add(es); //System.out.println(es.size()); //doc.getElementsByTag("img"); // 获取每一个img标签src的内容,也就是图片地址 for (Iterator<Element> i = es.iterator(); i.hasNext();) { Element e = i.next(); String r = e.attr("src"); Pattern p = Pattern.compile("http://.+\.(jpg|jpeg)"); Matcher m = p.matcher(r); if (m.matches()) { result.add(r); } } return result; }
    以上就是本篇文章【baidu.rar_baidu_baidu api_搜索引擎api_百度搜索api_百度的API】的全部内容了,欢迎阅览 ! 文章地址:http://sjzytwl.xhstdz.com/news/5174.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://sjzytwl.xhstdz.com/mobile/ , 查看更多   
最新文章
岚图蓝牙连接没有声音手机连接车载蓝牙放歌没有声音「岚图蓝牙连接没有声音」
如果岚图蓝牙连接没有声音可能是以下原因及对应的解决办法。 原因手机媒体音量未打开。 解决办法按下手机音量键将媒体音量调大同
美版iPhone 16系列无实体SIM卡槽 其他地区照旧保留美国苹果手机「美版iPhone 16系列无实体SIM卡槽 其他地区照旧保留」
  【CNMO科技消息】苹果新推出的iPhone 16、iPhone 16 Plus、iPhone 16 Pro以及iPhone 16 Pro Max机型,在美国以外的市场均继
电视/影音买三星手机「电视/影音」
*本网站提供的屏幕和图像内容,是仅为说明目的而展示的模拟画面。产品图片以及型号、数据、功能、性能、规格参数、用户界面和其
手机扩音器怎么连接电脑手机扩音器「手机扩音器怎么连接电脑」
在日常生活和工作中,我们有时需要将手机的声音通过扩音器放大,尤其是在电脑端进行视频会议或音频播放时。那么,如何将手机扩音
2025年1月北京朝阳区公共租赁住房剩余房源快速配租公告北京手机「2025年1月北京朝阳区公共租赁住房剩余房源快速配租公告」
  北京移动手机实名登记移动端操作指南:  1、去应用商店或者苹果Appstroe下载【北京移动】的APP,下载完成后,登陆北京移动
高通发布三款4G SoC 均支持Wi-Fi6关键特性手机soc「高通发布三款4G SoC 均支持Wi-Fi6关键特性」
中关村在线消息:近日高通宣布推出三款全新的移动Soc,分别是骁龙460、骁龙662和骁龙720G,最高支持4G网络,意在提升4G的体验。
Pixel 6 Pro评测:旗舰之争,「亲儿子」终于不再掉队pixel手机「Pixel 6 Pro评测:旗舰之争,「亲儿子」终于不再掉队」
​​外观大改、换用自研芯片的 Pixel 6 Pro 理所当然地成为了我今年最期待的新机。 原因无他,现在几乎很难再看到一台像 Pixel
「必备清单」让你的手机电量无忧!四种类型的磁吸充电宝移动电源全面解析手机移动电源「「必备清单」让你的手机电量无忧!四种类型的磁吸充电宝移动电源全面解析」
在当今社会,手机已成为生活必需品之一。但随着智能手机的进步,电量问题越来越受关注。为了解决这一难题,许多人选择购置可靠便
iPhone11什么时候上市的苹果手机11「iPhone11什么时候上市的」
众所周知,苹果手机在高端市场的知名度是非常高,而每一代的苹果手机在不管是性能配置还是上市时间也都是备受人们关注的,iPhone

loading