您现在的位置是:网站首页> 软件下载软件下载

b站视频下载爬虫工具-bilibili_video_download.exe下载绿色python版-软件下载

2021-05-21 182人已围观

简介 b站视频下载爬虫工具-bilibili_video_download.exe下载绿色python版-软件下载

bilibili_video_download.exe是一款Python编写做成的可以批量下载BiliBili视频的下载器软件,导入的库包括用于爬取和解析网页的库,还包括创建线程池的库和进行其他处理的库,大多数都是Python自带的。

软件说明

软件前言

在正常情况下(不使用其他工具或插件),Web端的bilibili似乎无法(彻底白嫖)下载视频,遂学习了如何利用Python爬虫下载b站视频(不包括会员视频),详情(手法)且看下文。

参考视频:https://www.bilibili.com/video/BV1Fy4y1D7XS

在分析b站网页源代码的过程中发现其视频和音频是分开的,下载后一个只有声音,一个只有画面,这显然不能满足我们的要求。解决方案是:利用 ffmpeg 这款强大的开源工具把下载后的音视频进行合并。故想要完美体验,先得下载安装并配置好 ffmpeg 。(到官网下载,解压后把文件夹内的bin 添加到环境变量)

Python中使用到的模块有:requests、re、json、subprocess、os

准备工作

视频的url比较显眼,容易获取。headers也好找,但还需要一重要信息。

通过浏览器(F12)查看分析目标网页,找到我们的下一目标,即视(音)频下载链接。

一番查找后,发现在head里的第四个script 标签内似乎有我们想要的东西。

可访问此链接,却出现403,即没有权限访问此站。

这又怎么回事?查看Request Headers 信息,发现没有referer这一项,于是尝试在数据包中加上referer信息看能否访问。(这里直接上bp了)

Forward后,出现文件下载页面。

下载后打开改文件,确为目标视频。

获取数据

通过requests库向目标站点发起请求,请求需包含header、referer等信息,以伪装成是浏览器发出请求。如果服务器能正常响应,会得到一个Response,便是所要获取的页面内容。

测试代码:

运行结果:

解析内容

得到的内容可能是HTML、json等格式,可以用页面解析库、正则表达式等进行解析。

title信息比较好找,就在head中。

利用正则表达式对其进行提取。

复制代码 隐藏代码 title = re.findall('(.*?)',html_data)[0].replace("_哔哩哔哩 (

下载资源

-六神源码网