【周记、复盘、计划】2018-12-09

周记

1、这周发生了太多事情,首先,爬虫这个事情班门弄斧,原来我一直以为代码中配置的代理 ip 无效,都是用本地 ip 采集爬虫的。真尴尬,前两周爬了两个网站没发现,这周爬取另一个网站 ip 被封才发现。所以 周五 周六 周日 三天都在解决这个问题。第一次一个问题纠结这么久,而且也没人可以讨论,周围没人玩这个。网上查到的办法 永远都是那两个,并且我使用后,无效!真不知道怎么办,头痛。因为这个事,这篇周记复盘本来都不像写,毫无头绪。

2、另外件大事应该就是谷歌云(Google Cloud)免费的 300 刀已经用完,也懒的找其他云服务器,本来用着也挺好的,准备付费接着使用。但是前两天才了解到,一张信用卡用完后,可以接着绑定其他账号继续使用这个 300 刀的服务。想想算了,谷歌没有这么蠢,或者这种小便宜是有后果的。但是也不能像以前那么奢侈开两个实例。所以只能将网站的实例和 ss 的实例整合一起。因为 ss 配置是最差的,一个月 5 刀。所以将网站重新部署到 ss 实例上。最后完成效果还行。 体验 ,看看账单多少,如果没问题 就这样吧。

3、最后就是裁员潮。气候的冬天来了,行业的冬天也来了,到处裁员,不仅仅互联网行业。心里还是挺紧张的,看了很多相关文章和资料,包括一些非常大家可能不知道的内容。按照康波周期理论所预言, 接下来的 2019 形势估计会更严峻。本来准备在跳槽前发展出一个「睡后收入」,到现在已经花费太多太多时间在这上面,种子已经种下,接下来果实怎么样就看用户了。也不准备折腾这些东西了,好好的学习课程,提升下技术。脑子里、笔记本里积累很多有意思的东西,所以坚持分享总结出来。

4、睡的很好!!!没跑步!!!

复盘

1、到现在,爬虫采集配置代理这个事真头痛,按道理我早就该想到。买的代理 ip 一直没扣钱,如果真的使用成功了,怎么可能不扣钱,还抱着侥幸。。。

解决办法有很多,爬虫频率控制在网站限制以内,或者使用工具做代理,将整个电脑环境代理起来。都不是挺好,纠结。

2、整合两个实例的事情早就准备做,一直拖到现在。还好圆满解决,当然前提是谷歌收费到底怎么样,会不会太贵。如果没问题,也不想太麻烦就这样吧。

3、到现在网站已经三周,什么都没做,全靠自然搜索流量,每天也有点流量。还能接受吧,主要不方便透露的原因,不能在自己博客做外链引流。不然效果应该会好点。采集站的最大问题应该就是「有收录也没展示」,希望能过这个坎。

计划

1、再花费 2-4 小时弄代理的问题,如果不行就算了,就麻烦点慢慢爬虫。

2、将手上剩下的活速度搞完,复习下 Java 相关基础知识,然后再学习门课程总结下博客。

发表评论

电子邮件地址不会被公开。 必填项已用*标注