【背景】
最近在研究语文本聚类分析,有些时候在语料里发现部分名称不知道是什么意思,那么就得使用百度进行检索,如“数智建造”,就得手动拷贝到百度的网页搜索进行查看。
(资料图片)
由于文本聚类分析,我是采用的MATLAB app designer进行可视化开发,那么我希望名词进行自动搜索时能跳过手动拷贝这一步
【实现准备】
这里需要用到百度api和urlencode函数来实现:
如百度搜索“数智建造”,浏览器搜索栏反馈结果如下:
拷贝出来的结果如下:
/s?wd=%E6%95%B0%E6%99%BA%E5%BB%BA%E9%80%A0&ie=UTF-8&tn=62095104_5_oem_dg
通过对以上简化,以下链接也是有效的:
但拷贝出来就是下面的结果:
/s?wd=%E6%95%B0%E6%99%BA%E5%BB%BA%E9%80%A0
因此,通过上面的测试,百度的api写法应该是【/s?wd=】
对应的“wd=”后面就是关键词,通过百度后面是URL编码,MATLAB里有urlencode可以实现字符串转换为URL编码的功能
以上,完成所有准备工作
【代码测试】
编写代码:
KeyWord = '数智建造' % 必须为字符串,char形式
web(strcat('/s?wd=',urlencode(KeyWord)));