利用Python爬取网易云音乐

jiusui · 2023-1-27 16:48:30

本帖最后由 jiusui 于 2023-1-27 16:50 编辑

import requests#导入请求模块
from lxml import etree#解析数据
import os

file="D:\Program Files (x86)\Desktop\Technology\Music\\"
if not os.path.exists(file):
os.mkdir(file)

#1.确定网址
#互联网上标准资源地址
url = 'https://music.163.com/discover/toplist?id=3778678'

#2.搭建关系  发送请求接受响应
#爬虫原理：伪装成浏览器
#字典键名键值键值对 {键名：键值}
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/53"
               "7.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36"
}

#工具 requests
#请求目标网站
response = requests.get(url=url,headers=headers).text
# print(response)

#3.筛选数据
res = etree.HTML(response)
# print(res)

#xpath
#模糊匹配我的名字叫做阿青名字阿青
a_list = res.xpath("//a[contains(@href,'/song?')]")
# print(a_list)
for i in a_list:
href =i.xpath("./@href")[0]
# print(href)
music_id = href.split("=")[1]
# print(music_id)

#media/outer/url
#拿到所有音乐的单独地址
music_url = 'https://music.163.com/song/media/outer/url?id='+music_id
music_name = i.xpath('./text()')[0]

# print(music_url,music_name)

#4.保存本地
#二进制
music_content = requests.get(url=music_url, headers=headers).content

with open(file +music_name +'.mp3',mode='wb') as f:
      f.write(music_content)
      print(f"下载{music_name}完成啦！")

小铭 · 2023-1-27 21:45:50

好东西

开朗的盟员 · 2023-1-28 21:51:50

妈妈再也不用担心我没有VIP啦！（偷偷问一句：QQ音乐可以吗？）

开朗的盟员 · 2023-1-28 22:06:51

等等，你这些的？pycharm专业版？

import requests#导入请求模块
from lxml import etree#解析数据

复制代码

jiusui · 2023-1-29 06:57:12

开朗的盟员发表于 2023-1-28 22:06
等等，你这些的？pycharm专业版？

是的

jiusui · 2023-1-29 06:58:05

本帖最后由 jiusui 于 2023-1-30 16:18 编辑

开朗的盟员发表于 2023-1-28 21:51
妈妈再也不用担心我没有VIP啦！（偷偷问一句：QQ音乐可以吗？）

也可以，但是还没写

[Python] 利用Python爬取网易云音乐

点评

点评

浏览过的版块

新人须知

常见问题

关于我们