美好的成都,最近却变成了“尘都”。 来自陕西或者其他地方的冷空气,带来了降温,也带来了沙尘。虽然有秦岭阻隔,但是灰尘仍然坚强的抵达了天府之国。 我们办公室楼层比较高,推窗远眺,之间灰蒙蒙的天,而敞着窗户一上午,沙发上就落满一层灰尘。 中学地理学的防护林去了哪里?
希望Google打造三位一体的输入法
最近一直为劳苦大众能有一款完美的输入法鼓与呼,说直白一点,就是希望Google能够斥资收购自然码和黑马。也许备用ID的观点代表着普通输入法用户的观点吧: 自然码要钱的,黑马也是要钱的,对于我们这些拿来主义者,好像不太现实,自然码再怎么好也没有用,不适合大众的推广……想着Google收购自然码、黑马吧。不过现在的Google拼音鄙人还是比较满意的,至少,比我用过的紫光,智能ABC,微软拼音啥的强。毕竟最重要的是:简单的投入成本——习惯摆在那里——迁移很简单,加上确实比较智能,比较适合人的思维角度来打字。 实际上,谷歌拼音、自然码和黑马各有特色,如果凭借Google的实力将三者整合起来,打造一个三位一体的输入法,我想真的是所有输入法用户的福音。 1、谷歌拼音(市场强势) 谷歌拼音目前没有太多的闪光点,主要是在线词库,但是自身强大的资源,足以傲视所有的输入法。 2、自然码(单字编码+专业词库+多功能平台) 自然码的主要特色是双拼+形实现极低的单字重码率,丰富的词库(你能想象很方便的输入化学分子式么?能想象输入lvjx就直接打出“老至居人下,春归在客先”的诗句么?),加上从黑马引进语句转换核心技术,几乎成为很多特色的集大成者。所欠缺的,是强大的市场推广能力。 3、黑马(语料库) 黑马的主要特色是多达120亿汉字的超大规模语料库来实现语句输入的高准确率。 不是传言百度也要做输入法么?而且还不仅仅是拼音输入法,而是一个输入法平台。传言中,百度把输入法市场分为两个层次:使用拼音输入法的低端用户和使用五笔等专业打字的高端用户。如果Google仅仅收购黑马,仅仅专著拼音输入法领域,很显然刚刚起步就被百度甩在身后。这种情况下,Google更是需要将自然码及早收入麾下——自然五笔也是非常成熟的功能了。 大家想象如果有这么一款免费的输入法,将是多么的美妙: 1、输入语句时,几乎不用选字(借助语料库实现语句输入的高准确率); 2、输入单字时,几乎不用选字(借助双拼+形实现极低的单字重码率); 3、盲打的时候,能够听见语音校对(自然码语音朗读功能); 4、将自己写过的文章读入输入法,并且上传至自己的网络空间,随身携带(自然码文风学习功能+谷歌拼音网上词库功能) 5、可以在全拼、双拼、五笔等输入法中自由切换(自然码实现的输入法平台功能) 6、自由输出多种格式:简体、繁体、拼音、内码等等(自然码实现的输出转换功能) 7、英文单词校对(自然码和谷歌拼音都具备的功能) 8、自己不会发音的汉字用其偏旁部首的拼音录入(自然码的难字切形输入功能) 9、装到U盘,随身携带(自然码的U盘安装功能) …… ān dé ɡuǎnɡ shà qiān wàn jiān ,dà pì tiān xià hán shì jù huān yán (切换至自然码拼音输出功能录入以上拼音)
伟大的时代
我只能赞扬这个伟大的时代 将伟大变成渺小 将奉献变成负担 地狱天堂,皆在人间~
回老家吃樱桃、枇杷
^_^
软件之都
谷歌拼音半月谈
谷歌拼音半月谈 2007年4月4日~2007年4月19日,谷歌拼音诞生半个月了。也许日子选的非常不好吧,谷歌拼音命运多桀,刚出生没多久就被“词库门”困扰。我们访问它的网站,除了16(修正自然双拼方案等)、17(词库等)而升级的版本外,这么久都没有动静了。是谷歌拼音没有需要修改的地方了么?我看不是——谷歌拼音远不完美。 作为拼音输入法的发展方向,也许有四个: 1、依赖辅助码(或者更高级一点,采用自然码的形码)降低重码; 事实上,最早的拼音输入法,都没有考虑辅助码的问题,但是由于严重的重码问题,使用其他一些花哨的技术,不能从根本上解决,所以正如自然码之父周志农先生所说,“火火的那些输入法再发展,就会考虑到辅助码的问题了”。事实上,这个在很多拼音输入法上已经体现了,但是却是不彻底的体现。 要说辅助码方式,最高级的就是自然码的形码。 当年自然码(音形码)和五笔字型(形码)争天下的时候,能够三分天下有其一,和自然码双拼加形的极低的重码率和极高的学习速度密不可分。现在的其他拼音类输入法,仅仅在汉字的横竖撇捺折上做些工作,完全没有做到像自然码一样使用偏旁的声母(自然码形码的一般规则)来减少重码。这个方式,被自然码称为字词方式,依然为老自然码用户所钟爱。这种发展方式,优点就是可以做到输入法的尺寸很小,速度可以很快(可以和五笔字型一争高下),缺点就是为了高效率、少重码,某些偏旁并非自己的声母发音,增加了记忆负担。 2、依赖语料的语句输入(比如自然码,智能狂拼,黑马等); 我们知道,自然码和智能狂拼都挂接了黑马的语料库,这种依赖语料库达到完美语句输入也是一种解决方案,只是这种方式,将导致输入法非常巨大,非一般用户所能接受。作为专业用户(比如“想打”的人们),基于效率和不破坏思维,可以接受这些巨大的语料库达到完美的输入效果。 3、依赖语法的语句输入(比如微软拼音2003); 具体技术细节不太清楚,但是从微软拼音2003的70M的尺寸也是有些难以接受(后面倒是发行了精简版,20M) 4、依赖人工智能的语句输入。 搜狗在其六点声明里提到“独立利用搜索引擎技术对发展人工智能做出的开创性贡献”,虽然我对搜狗拼音在人工智能方面的贡献持非常严重的保留态度,但是“人工智能”的确是输入法应该走的一条道路。遗憾的是,语言文字学和人工智能的学术研究虽然比较多,但是真正用到输入法的几乎没有。 事实上,我宁愿相信,Google在低调的发展谷歌拼音的人工智能技术,这从Google资助人工智能研究机构可略见端倪。以创新和技术为支撑的Google,会不会将AI用于输入法呢?我殷切的期待。说句实话,搜索和输入法,在某些方面,真的有相通之处。 拉拉杂杂说了这么多,总结一下吧: 1、谷歌拼音辜负了大家的期望,半个月都没有升级了。 2、拼音输入法加辅助码/形码降低重码率(或者说减少翻页)是必由之路,而自然码在这方面已经等其他拼音输入法十几年了。 3、语料方式的语句输入法并非完美的解决方案,但是在现阶段技术条件下,也是最理想的解决方案了,适合高端用户使用。 4、期望有一款输入法能真正AI起来。 Keepwalking说,“拼命叫嚣着的输入法们,他们的欲望太复杂,输入法本身的完善,恐怕远远不是放在第一位的考虑。”我只希望,在这个喧嚣的商业社会里,少些炒作,而能用心、用技术来做输入法,给大家献上一款真正完美的中文输入法。
KISS
一个人独守办公室,一口气看完了《UNIX编程艺术》的前三章,感觉受益良多。
程序员的悲剧
打字速度快是错吗? 又是N页手稿!
Python@Eclipse
安装Eclipse的时候,提示我: 标题:Incompatible JVM 内容:Version 1.3.1_01 of the JVM is not suitable for this product.Version:1.4.1 or greater is required. 安装JDK5,系统居然提示My Pictures 无效值,在网上找了一下资料,说是注册表的问题,里面存储的值要么为空,要么是光驱等非写入盘符,搜索一下,果然如此,将My Pictures 的值修正后就能够正常安装了。 不过……我正常安装了JDK5以后,运行eclipse,它却仍然这样提示我,结果网上再找资料,原来如此: 机子里装了oracle,oracle自带1.31版JDK,解决方法是在环境变量中的PATH里装你装的JDK1.42的路径写到oracle路径前面,这样系统就不会先找oracle的jdk1.31了!(CSDN) 不过,最后还是将python的插件正常安装到eclipse上了。
五星级公园——浣花溪
浣花溪畔,杜甫草堂。 成都把浣花溪公园打造的非常的漂亮,也算是成都的一张名片吧。 昨天LP发烧,吃药休息一宿后好像好多了,于是准备带她出去逛逛,而最好的地方就是离我们不远的浣花溪公园。 以前都是从北门进入的,这次步行过去,自然是从南门进入。在路上,看见很多情侣都偎依在一起坐在河畔的椅子上,让我们想起了在学校的日子^_^ 进入南门,发现了以前没有的东西——诗歌大道。以前似乎没有这个东东,它连接着两个广场,道路中央铺满了自先秦到清朝的代表诗作,而道路两侧则是当代的代表诗人。 此外还有紫竹林和万树山,上次都没有去过。万树山风景不错,真让人感觉不像在喧嚣的城市。 此时真正的感到,自己住在一个多么方便的地方,毗邻浣花溪、杜甫草堂、青羊宫、武侯祠等等名胜,幸甚~
