针对词的科学研究,想来每一个seoer都了解,而除开较为火热的百度有关搜索关键词以外,百度下拉框关键词应当也是很多人分析的范畴,但是大多数人全是对于下拉列表词的刷点击,终究百度下拉框关键词收集早已泛滥了。
百度往下拉的官方网宣布称呼是百度推介词(Baidu Suggest Word),民俗又称作百度想到词或百度下拉菜单。它是百度为了更好地便于众多网友检索,提升导入高效率而推行的一项服务项目。
举例说明,在我们在百度键入“营销推广”这四个字的情况下,百度就从强烈推荐词条库文件查找出以“营销推广”这两字开头的词条,并依据搜索指数从大到小排列,建立成下拉菜单。百度下拉菜单的最高数目为10条。
百度下拉框关键词的作用:
能够做为长尾关键词应用,做为文章标题应用,终究是客户检索情况下能够开启关键词检索挑选。
许多人将下拉词立即开展引流方法,例如曝出知名品牌,正确引导到规定的网页页面,你能开展收集剖析对手的有关实际操作,或是自已去曝出自个的知名品牌,仁者见仁,智者见智吧!
互联网上保留有许多下拉词的采集软件和源代码,这儿,本渣滓早已早已梳理过去了,这儿再度共享一下吧,昨天晚上有朋友们问及,实际上 来来回回全是这种物品,没啥非常的吧!
版本号一:
立即网页页面抓包软件完成下拉词的收集
def get_keywords(word): url=f"https://www.baidu.com/sugrec?pre=1&ie=utf-8&json=1&prod=pc&wd={word}" html=requests.get(url) html=html.json() #print(html) #print(html['g']) key_words=[] for key_word in html['g']: print(key_word['q']) key_words.append(key_word['q']) #print(key_words) return key_words版本号二:
应用官方网插口
例如:
https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd=seo&sugmode=2&json=1&p=3&sid=1427_21091_21673_22581&req=2
def get_sug(word): url = 'https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd=%s&sugmode=2&json=1&p=3&sid=1427_21091_21673_22581&req=2&pbs=%�%�%�%�%�%�&csor=2&pwd=%�%�%�%�%�%�&cb=jQuery_68&_=81' % word r = requests.get(url, verify=False) # 要求API插口,取消了HTTPS认证 cont = r.content # 获得回到的內容 res = cont[41: -2].decode('gbk') # 只留回到結果中json文件格式一段,而且编解码为unicode res_json = json.loads(res) # json格式转化 return res_json['s'] # 回到关键词目录版本号三:
另一个插口详细地址
def get_word(word): url=f'http://suggestion.baidu.com/su?wd={word}&sugmode=3&json=1' html=requests.get(url).text html=html.replace("window.baidu.sug(",'') html = html.replace(")", '') html = html.replace(";", '') #print(html) html = json.loads(html) key_words=html['s'] #print(key_words) return key_words实质上二和三全是同一个特性,大伙儿参考着看和用吧!
拓展版本号:
这儿有一个小窍门,便是在关键词后边键入w,会发生跟拼音以w开始的一系列关键词,例如“黄山市w”,会发生“黄山温泉”,”黄山市玩几日“,“黄山市五绝”等关键词(见上截屏)。因而,在我们把a~z解析xml一遍,会产生大量关键词。
def get_more_word(word): more_word=[] for i in 'abcdefghijklmnopqrstuvwxyz': more_word.extend(get_keywords('%s%s'%(word,i))) print(more_word) print(len(more_word)) print(len(list(set(more_word)))) return list(set(more_word)) #去重复实际操作def get_more_sug(word): all_words = [] for i in 'abcdefghijklmnopqrstuvwxyz': all_words = get_sug(word i) # 解析xml声母表 | 运用了上一个涵数 print(len(list(set(all_words)))) return list(set(all_words)) # 去这儿采用版本号二的插口方式,防止被和谐
可是应用requests控制模块要求一个资格证书失效的网址的情况下会立即出错
能够设定verify主要参数为False处理这个问题
r = requests.get(url, verify=False)可是设定verify=False会抛出去一个InsecureRequestWarning的警示
那样看上去很不太好
解决方案:
from requests.packages.urllib3.exceptions import InsecureRequestWarning# 禁止使用安全性要求警示requests.packages.urllib3.disable_warnings(InsecureRequestWarning)运作实际效果
为了更好地便于诸位朋友们应用和玩乐,本渣滓刻意给诸位朋友们装包了一下low版exe专用工具,便于诸位巨头哥应用!
exe专用工具获得
百度百度云盘
连接:
https://pan.baidu.com/s/1Zqst5fLhBZrIiR3XA14cXQ
提取码:
c7mt
参考文献:百度
百度往下拉-百度百度百科
https://baike.baidu.com/item/百度往下拉/7139864?fr=aladdin
张亚楠blog-seo技术流
PYTHON大批量发掘百度下拉框关键词
http://www.zhidaow.com/post/get-baidu-suggestions-by-python
Sch01aR#-博客园
Python-requests撤销SSL认证的警示InsecureRequestWarning解决方案
https://www.cnblogs.com/sch01ar/p/8432811.html
上一篇:怎么优化我们企业的百度搜索?