周记
1、这周发生了太多事情,首先,爬虫这个事情班门弄斧,原来我一直以为代码中配置的代理 ip 无效,都是用本地 ip 采集爬虫的。真尴尬,前两周爬了两个网站没发现,这周爬取另一个网站 ip 被封才发现。所以 周五 周六 周日 三天都在解决这个问题。第一次一个问题纠结这么久,而且也没人可以讨论,周围没人玩这个。网上查到的办法 永远都是那两个,并且我使用后,无效!真不知道怎么办,头痛。因为这个事,这篇周记复盘本来都不像写,毫无头绪。
2、另外件大事应该就是谷歌云(Google Cloud)免费的 300 刀已经用完,也懒的找其他云服务器,本来用着也挺好的,准备付费接着使用。但是前两天才了解到,一张信用卡用完后,可以接着绑定其他账号继续使用这个 300 刀的服务。想想算了,谷歌没有这么蠢,或者这种小便宜是有后果的。但是也不能像以前那么奢侈开两个实例。所以只能将网站的实例和 ss 的实例整合一起。因为 ss 配置是最差的,一个月 5 刀。所以将网站重新部署到 ss 实例上。最后完成效果还行。 体验 ,看看账单多少,如果没问题 就这样吧。
3、最后就是裁员潮。气候的冬天来了,行业的冬天也来了,到处裁员,不仅仅互联网行业。心里还是挺紧张的,看了很多相关文章和资料,包括一些非常大家可能不知道的内容。按照康波周期理论所预言, 接下来的 2019 形势估计会更严峻。本来准备在跳槽前发展出一个「睡后收入」,到现在已经花费太多太多时间在这上面,种子已经种下,接下来果实怎么样就看用户了。也不准备折腾这些东西了,好好的学习课程,提升下技术。脑子里、笔记本里积累很多有意思的东西,所以坚持分享总结出来。
4、睡的很好!!!没跑步!!!
复盘
1、到现在,爬虫采集配置代理这个事真头痛,按道理我早就该想到。买的代理 ip 一直没扣钱,如果真的使用成功了,怎么可能不扣钱,还抱着侥幸。。。
解决办法有很多,爬虫频率控制在网站限制以内,或者使用工具做代理,将整个电脑环境代理起来。都不是挺好,纠结。
2、整合两个实例的事情早就准备做,一直拖到现在。还好圆满解决,当然前提是谷歌收费到底怎么样,会不会太贵。如果没问题,也不想太麻烦就这样吧。
3、到现在网站已经三周,什么都没做,全靠自然搜索流量,每天也有点流量。还能接受吧,主要不方便透露的原因,不能在自己博客做外链引流。不然效果应该会好点。采集站的最大问题应该就是「有收录也没展示」,希望能过这个坎。
计划
1、再花费 2-4 小时弄代理的问题,如果不行就算了,就麻烦点慢慢爬虫。
2、将手上剩下的活速度搞完,复习下 Java 相关基础知识,然后再学习门课程总结下博客。
本文由老郭种树原创,转载请注明:https://guozh.net/%e3%80%90%e5%91%a8%e8%ae%b0%e3%80%81%e5%a4%8d%e7%9b%98%e3%80%81%e8%ae%a1%e5%88%92%e3%80%912018-12-09/