反向划水的船员

夏末单位搞趣味水上运动会,以前的单位搞趣味运动会都有些有趣的创意游戏项目,这回把场地搬到水上,我很期待会有更新颖的项目。遗憾的是混乱中我没报上项目,只在岸上做了观众。

首个项目水上拔河中,参赛选手在比赛和观赛中不停地讨论经验和制定团队方案,观众席上大家也跟着出谋划策。几局下来几乎所有人都发现在泳池深水区边的队伍胜出几率大,原因归于深水区阻力大,有稳定的优势。后面参赛队伍都在祈祷能抽签到深水区,而抽到浅水区的队伍则在想方设法逆转劣势。

大多数队员大概从没玩过这种项目,甚至参赛队伍也是零散搭配组建,可想临时团队配合是多么混乱。不过趣味运动会重在趣味,也不必太过看重竞技性了。无论用什么策略、技巧,总之所有队员都使出最大力气。

第二个项目是5人划香蕉船,这个项目需要更默契的团队配合才能保证船的行驶方向,特别是折返点掉头难度很大。各队尝试了不同的策略,有的喊口号统一动作,有的像划龙舟一样反坐船头当指挥,有的干脆跳下水推行。可所有参赛队伍出发后,就立刻偏离航向冲进旁边的赛道,撞到一起。大家都很用力的划桨,可船还是不听使唤的乱冲。有的队员时不时换边划水想要调整方向,喊口号、指挥什么的几乎也没用,混乱之中没有人顾及的过来。乱作一团的赛场,倒是给观众带来很多乐子。

又一局比赛开始,我发现一位船尾的队员根本没划水,而是将桨左右来回插进水中,甚至反向划水,我指着那人和我旁边的同事说,说完才想明白怎么回事。原来他是在根据情况控制航向。前面的队友都无暇顾及地猛划,他则在最后冷静的观察并作出反应。虽然他们的速度不及别人一半,但终因相对明确的航向首个到达终点。

这令我想到团队合作中配合与方向的重要性,团队中不一定需要每一位都是力大的强者,更要有把握方向的人,而且有时候这种人所做的贡献并不为人所知。

【新闻源监控系统】具备了自然语言处理特性

新闻源监控系统】发布了0.3.1版本,作为技术探索性项目,本次更新在0.2.0的基础上,增加如下新特性:

  • 爬虫与 API 部署到 docker 容器中
  • 系统具有了人工智能 NLP 特性,包括关键字提取、新闻分类、情感评价。模型都采用 NLP 工具现成的,在情感评价和新闻分类上的准确率还有待提高。
  • 关键字提取使用 HanLP
  • 新闻分类使用 THUCTC
  • 情感评价使用 SnowNLP
  • 移植爬虫到 python scrapy 框架下

顺着新闻分类的开发,看了一下朴素贝叶斯算法,不过还需要先复习复习线性代数。

文章《我是如何用机器学习技术帮助 HR 省时间的》中,提到的三种机器学习的文本分类算法: TextGrocery,fastText,Naive Bayes都值得一一细看一下。

我为什么从媒体转行做Web开发

兴趣爱好

接着【我的工作为什么失败】系列上一篇记述的,从腾讯大楚网离职前的“愚人节项目”中,唯一外包的工作是移动端小游戏页面。创意工作是为每位参与者提供一个自由发挥的机会,所以外包这种更适合完成某项具体固定需求的合作,产出差强人意的结果,成为我圆满“这份工作的夙愿”中的遗憾,不过它另我重拾对网页制作与计算机语言许久以前的兴趣。

回到2002年,从玩文曲星(80后应该都熟悉这些电子词典)的GVBasic,结缘了编程语言,到跟随个人站长热,结缘了网页制作。那时候我在的小城市宜昌似乎互联网还未普及,也或者是我没条件接触到,根本无法找到Basic的教材,因为我甚至不知道自己要找的是什么,只有不断翻看文曲星上的帮助,然后把语句记下来打进去看效果。后来读书和工作中也持续保持关注这些领域,为自己、朋友做一些小项目。

回到原点

转行做Web开发,只是终于又回到原点。毕业后我找的第一份工作就是“网页制作”,2010年那时候我还没听说过“前端开发”这个职业。只是这份工作仅做了两个星期就根本没算作职业经历。内容是给武汉一私立家幼儿园做网站。那段时间媒体上一窝蜂“报复社会者进幼儿园行凶”的新闻,于是园长说给我做个袖章,叫我上学放学时候站门口当保安,可笑之余我正好得到搜房网的offer,离开Web开发领域,回到宜昌开启一段媒体生涯。

务实、进步

再者我越来越意识到,技术开发类工作中少有务虚成分,每一分努力都是为让设想中的产品更加展现出它应该有的样子。交互流程不合理、界面设计令人畏惧、代码逻辑有误都是无法回避的问题,做开发的人起初只有硬着头皮接受错误,逼迫自己正视错误、拥抱错误,然后用优雅的方法来解决之,这才是工作的价值所在。当然最后还要反思和采取措施来杜绝类似问题再次发生。

这样的工作循环会将人的思想或能力不足暴露无遗,同样也更能推动个人与团队的成长。我爱这样的循环,那么转做Web开发也是我选择的必然了。

返回【我的工作为什么失败】系列目录

【新闻源监控系统】——一位网络新闻编辑的Web全栈开发实践

在大楚网做新闻编辑的时候,我一直梦寐以求有个工具,让新闻监控和部分转载工作自动化,这样我就能更优雅的编辑标题和写Tips了,所以我开始尝试做这么个工具。

新闻源监控系统(Auto News System)

项目名暂定——新闻源监控系统(Auto News System)

现在还只是个雏形,已实现监控、记录、查询【湖报系】【长报系】【大楚网】的新闻更新。

送给所有在编辑岗位辛勤工作的编辑们。


现状

当前监控爬虫运行在自己的电脑上,偶尔会离线,应用界面右下角有标示当前监控服务器在线、离线状态。

Bug与需求请在文末留言,我会尽快反馈、处理。


动机

加过一个群,名叫”苦逼的网编停不下来”的群,是6年前我在一房产网站做编辑的时候,群里都是全国各地站点的编辑们。大家在群里讨论工作、发闹骚,最热闹时每天群里会有上千条消息。

断断续续做记者、编辑约6年时间,觉得网络编辑还算件有乐趣的工作。每天早上打开电脑,从各处搜集信息,然后筛选、编辑、归类、比较、分析、排序、制作封面配图、发布,最后得到有序的新闻条目、房产行业信息和漂亮的页面,心里有大大的满足感。

但编辑中有大量枯燥重复的工作,汇总零散信息、人工值守新闻更新、复制粘贴。3年前有过用自动采集方案来代替的想法,简单弄过一段时间”按键精灵””火车头采集”,但技术实力不过关,实际工作中并没起到什么作用。

现在虽然不做编辑工作,但作为一个 Code for a Better World 的 Web Developer,我觉得这会是一项有意义、有挑战的工作。

计算机简直是做这些辛苦工作的最佳”人选”,所以可爱的小编们就能解放生产力,将更多精力投入到思考、学习、设计、撰写等方面,将编辑工作更提高一个层次。

“苦逼的小编”也可以停下来,有更多时间优雅的喝咖啡。感觉生活都变更美好了呢:)


实践意义及技术实现

2000年接触Web页结缘Javascript,到如今NPM成为世界上最大包管理器NPMNodeJS的软件包管理器),让我发现,我能利用现有能力去解决很多以前难以解决的问题,顺便收获一些现在没有的能力。

当前的技术实现包含:

未来开发自动新闻分类的时候,还能接触些中文自然语言处理