中国情人节——七夕节(别称:乞巧节、七巧节、七姐诞、道德腊,英文名:Double Seventh Festival)被赋予了“牛郎织女”的美丽爱情传说,使其成为了象征爱情的节日,从而被认为是中国最具浪漫色彩的传统节日,日期是每年农历七月初七,有拜月祈福、拜织女、吃巧果、乞求姻缘等习俗。
随着七夕的临近,很多小伙伴都开始筹备送女朋友/男朋友的礼物了,礼物作为一种传达情感的媒介,表达了对于女朋友/男朋友的祝福和心意,但同时对于要送什么礼物,对于很多小伙伴来讲倒是选择困难,本文利用 Python 爬取某宝商品页面,为小伙伴们分析销量较高的礼物清单,以供大家参考。
根据不同关键字,爬取“某宝”获取商品信息(以“七夕礼物”、“七夕礼物送男友”、“七夕礼物送女友”等为例),根据所获取数据分析得到七夕礼物清单,并通过词云可视化的方式展示不同礼物的频率比重对比。
爬虫少不了网址,因此首先观察网址的构成,在输入关键字“七夕礼物”进行搜索时,发现网址中 q 的参数值即为所键入的关键字“七夕礼物”,如下图所示:
虽然也可以直接复制网址,但是这种方法的弊端在于,每次想要爬取其他类别的商品时,都需要重新打开网页复制网址;而利用 q_value 变量构造网址,当需要获取其他品类商品时仅需要修改 q_value 变量,例如要爬取关键字“七夕礼物送男友”,只需要做如下修改:
使用浏览器“开发者工具”,观察网页结构,可以看出商品的信息都是在 <script> 中,
因此,首先使用 requests 库请求网页内容,需要注意的是,在请求页面信息时,需要构造请求头中的 cookie 和 user-agent 信息,否则并不会得到有效响应,获取 cookie 和 user-agent 信息需要在浏览器“开发者工具”中的网络标签下单击当前请求页面(如果网络标签下没有当前请求的页面,需要刷新后才可以显示),在标头选项卡中找到请求标头的 cookie 和 user-agent 值并复制,按照以下方式构造请求头:
下图显示了获取 cookie 值的示例(获取 user-agent 值的方式类似,只需在标头选项卡中找到
请求标头的 user-agent 值):
得到响应网页后,需要使用 BeautifulSoup4 与正则表达库 re 解析网页,获取商品信息:
需要注意的是,由于一开始使用 utf-8 方式解码网页,并不能解码 Unicode,因此打印详情页地址和封面图片地址会看到解码不正确的情况:
因此需要使用以下方式进行正确解码:
为了将数据写入 csv 文件中,首先创建 csv 文件并写入标头:
然后,由于英文逗号(",")表示单元格的切换,因此需要将获取的数据经过预处理:
最后将预处理数据后,将数据写入 csv 文件中:
通过查看第2页以及第3页,网址:
可以看到,网址的不同仅在于第二页的 s 的参数值为 44,而第三页 s 的参数值为 88,结合可以每页有 44 个商品,因此可以使用以下方式构造爬取20页商品:
可能很多朋友(并非)是为了学习技术才点击进来的,完(shun)全(bian)是求知若渴的想知道要送男朋友/女朋友什么礼物,别着急,大家最关注的部分来了。接下来使用词云可视化分析,分别考虑包含销量与不包含销量两种情况。
不考虑销量时:
接下来考虑销量:
可以看到差别还是较为明显的,最后将分词结果,进行排序,手动去除无效词后,归类整理出排名前15的礼物清单:
❤️礼物清单❤️
以同样的方法,将关键字改为“女友+礼物”,可以得到❤️送女朋友礼物清单❤️:
最后,将关键字改为“男友+礼物”,可以得到❤️送男朋友礼物清单❤️:
可以看出,送女朋友和男朋友的礼物还是有一些差别的。 当然,和主观感觉上有很些差异的原因可能在于,很多商品的标题太过创意,完全不包含商品。
当然,本文仅做分析之用,结果也仅供参考,如果清单里没有令你心仪的礼物,也可以选择红包或者清空购物车的方式。无论送女朋友/男朋友什么礼物,传达自己的❤️心意❤️最重要了。
在选择一个适合你项目的Web开发框架时,常常会遇到 Flask 和 Django 这两个流行的选择。两者都有其优势和适用场景,本文将探讨它们的特点,并通过代码实例和解析来帮助你更好地做出选择。Flask vs. Django 简介Flask 是一个轻量级的 Web 框架,它以简单和灵活著称,可以快速构建小型到中型规模的 Web 应用。相比之下,Django 是一个功能强大的全栈 Web 框架,提供
在开发中,创建线程是多线程编程的基础,也是面试中的常见问题。本文将介绍四种常见的线程创建方式:继承Thread类、实现Runnable接口、实现Callable接口,以及使用线程池。通过对比它们优缺点,帮助你在面试中准确选择合适线程创建方式
WebSocket技术为现代Web应用提供了强大的实时通信能力。虽然它在实现上可能比传统的HTTP轮询复杂,但它带来的用户体验提升是显而易见的。随着技术的不断进步,WebSocket有望在未来的Web开发中扮演更加重要的角色。
嗯,不过七夕的都是靠实力单身的。
“你是个好人,但我绝不会接受一
在这个全球闻名的 “世界超市”——义乌,礼物经济蓬勃发展,不仅在七夕,每年众多节日的礼物都从这里畅销至世界各地。从精美的饰品到浪漫的玩偶,义乌凭借强大的产业集群与高效供应链,成为全球节日氛围的重要 “供应商”。一组动态海报解码义乌礼物经济↓↓↓
七夕礼物
# 如何用Java写七夕礼物## 一、整体流程首先,让我们通过一个表格来展示整个过程的步骤:| 步骤 | 描述 || ---- | ---------------------------- || 1 | 创建一个Java项目 || 2 | 创建一个类来表示礼物 || 3 |
找出最适合你的恋人!答案明天附上!!1.你会想和那一种异性约会? a. 看来老实又内向的(接第2) b. 会玩又会懂得打扮的(接第3) 2.有个人边看表边跑,他迟到了5分钟,你觉得他心理怎麽想? a. 才5分不算迟到(接第4) b. 糟了!迟到了!(接第5) 3.有个家庭主妇正在打扫,你觉得她正在怎麽想? a. 我要扫得一尘不染(接第6) b. 差不多就
情人节礼物的意义情人节的礼物,不在于贵重,而是在于在乎和关心对方的心思。下面一起来聊聊,适合给IT男朋友送什么专属的七夕情人节礼物。实物类礼
八月的雨水多得可以汇成一首百转千回的奏章,而我在这忧伤而美丽的奏章里起伏跌宕。影影错过,是刻意?还是错过? 八月初的时候,决定删掉小z对我的记忆,我在他的世界离去。结果终是没有成功。 今天是七夕,那个我曾无比喜欢的节日。无比喜欢是因为有你还是有他。我忘记了。只是喜欢。其实一直在等小z对我说一句话:“七夕是你的节日。”是的,七夕是我的节日。他说的,我记住的。那句话,他2005年说的、2006年没说,
什么最浪漫?不确定,却坚定地去接近一份模糊的美好在山穷水尽时在灯火阑珊处,忽然遇见,不论得失很久以前我们约好
咨询了大家,终于确定了礼物 。
七夕就要到了,在这个有情人终成眷属的好日子里,小安在这里给大家带来Python的小福利,在七夕利用Python制造两个人之间的甜蜜。二人世界里少不了属于两个人之间的甜言蜜语,而这些悄悄话也是记录了两个人从相识到相知再到在一起的甜蜜。 如果我们把这些甜言蜜语都收集起来,做成一个心爱的甜心,在七夕节的当天送给自己的另一半。这样既用心,而且还很甜蜜的操作,是不是很酷!说干就干,接下来,小安就带领大
什么Linux服务器最适合你?来自:wxy 1天前 | 阅读原文 无论你是什么样的规模,总有一款发行版很适合。 说到买衣服,我跟普通人一样。我只想走到一家商店,取下合适的衣服,买下后(什么,试穿一下?你是在开玩笑吗?!),直接回家。没错,我就想这样。 这些年来,我明白了这点:就因为某东西应该会合适并不意味着它就会合适。Linux服务器方面也是如此。当然,它们都基于同样的代码库而
使用vasp计算α-SiO2弹性模量文件下载由于vasp wiki的example里有alpha-SiO2的样例,故INCAR、KPOINTS、POSCAR、POTCAR文件可以从vasp wiki直接下载输入文件选用因为需要计算弹性模量,所以修改(添加)如下INCAR文件参数IBRION = 6ISIF = 3NFREE = 4NSW = 1ENCUT收敛性测试选用官网样例中默
教务管理系统(面向对象设计)开发博客 目录 一、AI工具辅助选题 二、选题与前期调查 三、系统功能设计 一、AI工具辅助选题 本次教务管理系统的选题与前期设计,仅借助豆包这一AI工具提升效率。 1.梳理面向对象设计的核心逻辑,明确「学生-班级-课程-教师-成绩」的关联关系,输出类设计的初步思路与规范 ...
在构建一个演示稿效果的JavaScript幻灯片插件时,拥有自定义主题和布局的能力是至关重要的。这一能力不仅能够确保插件能够适应各种不同的场景和品牌风格,而且还能赋予演示文稿更个性化的视觉效果。在本章节中,我们将深入探讨如何策略性地定制主题,并实现具有高度个性化的布局设计。
在多端、多团队、微服务生态中,BFF、GraphQL 与 API Gateway 分别承担不同的职责。正确的选型不是三者互斥,而是基于场景做组合:Gateway 做治理与边界,BFF 做端定制编排,GraphQL 提供灵活查询与客户端驱动数据获取。本文逐层对比定位、优劣势与交互模式,给出选型矩阵、混合架构范例、工程接入模板与实战建议,帮助团队以最小成本达到最佳体验、可维护性与治理效果。文中包含流程图、对比表与落地检查清单,便于决策与工程实施。