分类'Tech Mess'的存档

解决 svn 在 terminal 里面的乱码问题

前几天用 macport 装 git 的时候顺带升级了一下 svn,没想到原来的英文提示变成了乱码,莫非支持中文了?在 terminal 里面看上去超级不爽,但当时急事在身就没管。

今天搜了下,解决方法很简单,是 terminal locale 和 svn 编码不符,编辑 ~/.bash_profile,加上 export LANG=en_US,搞定!

发表评论

Bayesian Classifier

Naive Bayesian Classifier, 朴素贝叶斯分类器,简单的说就是给出一些关键词,系统可以自我学习的对文本进行处理之后完成分类。

在Ruby Cookbook 1.20上给出了一个方法,用的是收录到gem中的Classifier::Bayes。rubyforge中的位置是http://rubyforge.org/projects/classifier,现在的版本是1.3.0

Ruby方面还有一个实现bishop,是Python上 Reverend直接port过来的,rubyforge中的位置是http://rubyforge.org/projects/bishop/,现在的版本是0.3.0,好像不活跃,ROR上面还有一个plugin,可以用act_as_classifiable

这个东西在邮件反垃圾,文章相关性分析上有不少的应用,在Google中的结果看应该是比较成熟的东西

technorati tags:, , ,

Blogged with Flock

发表评论

最近主题:

最近评论

  • g.zhen.ning: 有道理,有点喜欢ruby,不过不知道前...
  • Suave: rails 还是挺有局限性的,ruby 是个更...
  • g.zhen.ning: 对,rails越用越顺手~,交流还谈不上,...
  • Suave: @g.zhen.ning 跟着 rails 版本走事件挺有...
  • g.zhen.ning: 看了你写Web 开发大全 - Ruby on Rails 版...