零基础学爬虫技术
Python
Allie
1人收藏 352次学习

零基础学爬虫技术

你可以使用任何熟悉的编程语言来进行网络数据信息的抓取,但是当你所需要获取的数据有限时,这样做就显得没有什么必要了,此时,一分钟技巧刚刚好:只需利用google sheet就可以实现了:

1、新建一个空白文档:

2、前提是时用chrome,打开我们的案例目标网页:Games sales,单击右键选择inspect,之后使用组合键Command-Shift-C ,用来激活selector,如此一来,你的光标移到哪个元素上,对应的信息就会在Inspection panel内显示:
组合键:Command-Shift-C

3、将网址复制粘贴到文档中:

假设我们需要抓取的信息是:价格

那么接下来只需要使用一个公式就可以实现数据抓取了:

首先将网页中所需信息的那段代码copy下来:

在文档中,实现抓取的函数是:=IMPORTXML(“URL”,”Xpath expression”)

其中,Xpath expression就是你粘贴过来的那部分代码,需要注意的是,代码中“”号需要变成‘’号:

如此一来,简单的数据抓取便实现了:

实际上excel也有类似的功能,就等你去探索喽。

还有另外一个常见的函数:=IMPORTHTML(“URL”,”QUERY”, Index)

这个函数可以实现整个表格的抓取:

加入1KE学习俱乐部

1KE学习俱乐部是只针对1KE学员开放的私人俱乐部
标签:
爬虫