集智专栏
资源加载中,请稍后...
集智专栏

集智专栏 - 趣味项目

Cogito, ergo sum

在Dota等MOBA类游戏中,英雄阵容的选择是至关重要的,这是一个动态博弈的过程。因为地图是唯一的,故Ban/Pick的过程主要考虑的就是英雄之间的配合与克制关系。而Dota里的英雄并不像Pokemon存在显式的明确克制关系,这种关系只能从统计中去挖掘。本文将探究一下DotaMax提供的“克制关系”是如何计算出来的。

一套完整的数据分析+机器学习流程,从数据获取(反爬虫机制),数据清洗到最终的机器学习与数据可视化。 猫眼电影票房数据(piaofang.maoyan.com)的反爬虫机制很有趣,是采用了来自美团网的加密字体系统,虽然前端人类读者看到的一切正常,但那是样式表渲染(相当于解密过程)的结果,而爬虫从后台得到的数据,都是密文。 作者直接绕过了破译密码,而是从模式识别的角度,由爬虫自动采集前端图像,再进行分割,最后只用支持向量机分类算法,获得真实的数字。

来自知乎的问题:“python如何把excel每一行数据,用selenium逐个放百度里查询,并把查询保存excel?” Selenium是化学元素“硒”的英文名,这里指的是一套多平台的网络自动化测试框架,支持Java、C#、Python等语言。但是这里使用Selenium并不合适,反而常规的爬虫框架更加高效。本文以Python为例来回答此问,并实现一个简单的小项目,将储存在excel中的一系列关键词逐个进行百度搜索,并将返回的特定查询结果存储至原excel文件的另一列。

问题来自知乎,题主在使用Python的BeautifulSoup4库爬取网页时,在获取特定html标签内容过程中遇到问题:一是爬取文本内容失败,二是从文本中提出特殊符号,如括号。 Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。

艺术从来就不是画家们的专利。在计算机硬件还无法绘制图形的年代,极客们就已经开始考虑使用纯文本——也就是ASCII码来进行绘图,从而实现简单的UI界面,甚至是编写画面精美的RPG游戏。本文将介绍使用Python来将图片转换为多行的ASCII字符串的相关知识,并带您重温那个古老的命令行时代。

Quick,Draw是来自Google的一些工程师完成的一个网页小游戏,其本质上是一项人工智能实验项目,使用神经元网络和机器学习方法来猜测用户所绘制的图形含义,并在不断练习中进一步提升其识别能力。通过这个游戏,普通人也能参与到复杂的机器学习过程中来,同时领略到目前人工智能的强大之处。