在《基于 Selenium 实现的必应企业信息抓取工具》文章中,曾提到使用 Python 开发一个脚本,能够补全企业的名称,方便在爱企查等直接批量导出潜在客户名单的详细信息,其原理就是:

  1. 爱企查中能搜索到,并且是第一个出现的。
  2. 必应搜索中能搜索到,并且是第一个出现的。

近期,在处理一批储能行业展会上获取到的客户名单,也是很多简称,所以,就需要对企业名称进行补全,因为只是简称,很难定位到底是哪个企业。

如果定位错了,那就从源头一开始就错了,那接下来做的全部分析工作都将毫无意义。

所以,这个企业全称以及定位,看起来好像是很小的事情,实际上非常重要。

但会面临一个问题,就是企业简称,通过爱企查等平台,检索出来很多重名的企业,应该选择哪一个?好像企业 A 和企业 B 都有可能,那到底是哪一个呢?

我就一直在想这个问题,就是怎么解决?

  1. 判断一:与储能有关联的,比如是储能集成商、储能主机厂、储能投资商等
  2. 判断二:企业规模大小,因为这些名单肯定不是随便哪个地方获取的,一般是行业展会,这就意味着这些企业是有一定知名度的。
  3. 判断三:使用必应搜索,出现在最前面的企业,意味着 SEO 优化做得不错,也意味着更多人访问,也是知名度的一种体现。

我相信,通过这三个判断,能定位到目标企业,虽然精准度不是百分之百的。

因为有些企业,甚至网上的信息都没有,这种你要怎么办呢?

还有些企业,自身规模的发展情况,也不太理想,虽然是真正的目标企业,但是,这些定位到了,跟没定位到差别不大,最终还是先筛选掉的。

所以,只能说已经竭尽所能了,能够处理遇到的百分之八九十的情况,至于剩下的百分之十的情况,只能看运气了。

毕竟,运气也是做成一件事情的一部分因素。