Author: Ken

  • 夜游天安门

    尼玛啊,读了两个小时之后,发现喉咙痛,都是“吐痰”吐的,午睡的半个小时可能是空气太凉,环境太安静,被楼外汽车喇叭和装修的声音惊醒好几次,当然了,神经衰弱也是有可能的。昨天的雪实在是太小了,地面只是打湿了一点点,今天就已经完全不见影踪,我在路上的时候的确想过要告诉你,而且我也想过我不告诉你你肯定会问我,但究竟为什么没有告诉你,这个原因,我的确是想不起来了,最近似乎有点健忘。

    七七问我下雪没,我说下了,然后告诉她周一上扣扣找我要于辛庄的照片,已经过了两个月,都还没发给她。牛牛说下雪了吧,爽了吧,我说太小了,雪花都看不到,她说慢慢来,一下太猛怕你hold不住。

    和公司女同事走得很近的结果就是,很多明里暗里的八卦不经意间就透露了出来,然后发现这个男女关系好像有点混乱,比如这个谁和那个谁,又和那个谁这个谁,以我如此敏锐的眼光,居然没有看出来,她们将这种情况总结为我一旦涉足恋爱关系,智商立刻从高位跌至负数,失恋之后变为零,然后随着时间慢慢上升。

    走出大厅的时候,突然觉得,似乎有点无聊,于是转向地铁站,前往天安门。倒不是没有看过夜色中的天安门,很多次深夜从出租车里看着路过的天安门和人民英雄纪念碑,既没有庄严也没有肃穆的感觉,就和看见常见的高楼一样。天安门附近和我记忆中的没有太大变化,这些看起来不太明亮的街灯上摄像头最多有十个,最少的也有五个,对着各个方向,但是都没有红外摄像头,可见还是主要依靠人力进行防控,长安街上其它的岔道或者地下通道,都有红外摄像头。以前拍照片,总是不喜欢把人拍进去,一是我不太喜欢活物,二是很难有一种整齐的美感,后来我觉得,没有人物参与的照片,其实是很不生动的,而且很难产生故事情节。天安门广场上人很少,大概只有一百人不到,几乎都在拍照片,没有闲逛,停留的路人,我在门口走了几个来回,有一对年轻夫妇让我帮他们合影,应该不算年轻吧,男人都有啤酒肚了,女人身材也很壮硕,拍了两张,女人拿过相机仔细的看了又看,很满意的谢过我。有一对情侣把我当作韩国人,先用朝鲜语嘀咕了一句,然后说“你是中国….”到了一半改用英文“Are you Chinese?”我说:“中国人”,说出来我就后悔了,我应该回答:“I’m Indian”,女孩子笑得不行要拉着男孩子走,男孩子还在边走边说你的打扮好像韩国人哦!

    当手脚都被冻僵的时候,其实并没有痛感,因为已经麻木了,首先感受到压力的是心脏,被冻过的血液回到心脏,引起一些不适感,并不是我不怕冷,而是如果只是因为怕,就不去做一些事情,那这人生,未免也太过平淡。

  • 封掉垃圾搜索引擎

    一般来讲,很多人都喜欢自己的网站有很大的流量,但有时候很多流量其实是垃圾流量,有选择性的过滤掉搜索引擎,很有必要,比如Sogou,每个月抓得比Google还要勤奋,但是在它里面搜来搜去居然一个结果都没有?简直让人莫名惊诧,比之于Sogou和Google带来的人流量,封掉它就显得很有现实意义了。

    针对上述情况,要封掉的其实不止Sogou一家,那么我们确定,只留下Google和百毒,其它搜索引擎都不让访问,然后呢,我们不允许这两只爬虫索引图片文件,MP3文件,还有其它多媒体文件,这一步我们在robots.txt里面设置:

    User-agent: *
     Disallow: /
    User-agent: Googlebot
     Disallow: /*.jpg$
     Disallow: /*.png$
     Disallow: /*.mp3$
     Disallow: /*.wmv$
     Disallow: /*.gif$
     Disallow: /*.cgi$
     Disallow: /*.gz$
     Disallow: /*.js$
     Disallow: /*.css$
    User-agent: Baiduspider
     Disallow: /*.jpg$
     Disallow: /*.png$
     Disallow: /*.mp3$
     Disallow: /*.wmv$
     Disallow: /*.gif$
     Disallow: /*.cgi$
     Disallow: /*.gz$
     Disallow: /*.js$
     Disallow: /*.css$

    很显然,这样的设置,对于病(bing.com)这种国际搜索引擎是很有效果的,但对于Sogou这样的垃圾搜索引擎,效果不大,它依旧是我行我素,所以,我们需要通过甄别其User-Agent,然后在web服务器上过滤。

    那么,我们可以在Nginx中设置如下,对于符合Sogou机器人UA的访问,一律给它返回400错误,一般来讲,我们见到的web服务器错误有404,403,500,502,503等等,但这些错误都是临时性的,会导致机器人间隔持续访问,返回400错误,可以告知机器人,除非你改变client端请求,否则你无法得到正确结果。

    location / {
                    if ($http_user_agent ~ Sogou) {
                    return 400;
                            }
    这段的意思很明显,我就不解释了。
    然后,所有Sogou的访问都会被400掉:
    123.126.50.70 - - [28/Nov/2011:22:45:23 +0800] "GET /2011/04/26/ HTTP/1.1" 400 172 "-" "Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)"
  • 有些尘封了

    今天上午,两个月的电话录音居然有1100MB,这的确出乎我的意料,不过考虑到十月份的时候我打了很多电话,暂且忽略掉这个事实吧……

    今天下午,我怀着把婷妹相机搞烂的心情使劲把她滑盖摔坏的富士Z200不能滑开的滑盖用力滑开,然后,TMD居然滑开了…..然后我发现一个惊人的事实,卡西欧和富士的电池是一样的…..根据我英明的估计,所有日系相机的NP系列电池都是一样的……Nippon嘛。数据线没统一起来,电池倒是先统一起来了。

    今天晚上,我完全没有吃饭的胃口,吃到最后一口差点吐出来,当然,在下依靠坚强的毅力使劲将涌上来的冲动咽了下去。

    今天早上,不知道从什么时候起看书完全没有了状态,有时候就在那里呆坐着放空,但又没有想睡的意思,我觉得,这需要改变。

    谧谧说她生了,突然发现照片上唐妈妈好像一个人,喔,有些尘封了。

    同性恋MM打电话来,说她在建国门,问要不要她过来陪我几天,我说你自己看着办吧。