David's profileprowyh's spaceBlogLists Tools Help

Blog


    May 23

    behavoir arts

    书海无涯,咱慢慢走……
     
    艺术与“艺术”
    May 21

    一本糟糕透顶的书

    如果从上世纪80年代早期在北京王府井大街的一个小巷子里一个不起眼的小屋中接触英文影印版书算起,到现在已快30年了!
     
    英文影印版书,让人想起来就暖暖的。早期,让无缘接触原版的我辈读书人,也能够以付得起的价格,买回一本本用“蝌蚪文”写成的书。现在,虽然可以在amazon.com上订到原版,但无奈囊中羞涩(在浦东国际机场看到Bill Clinton的《My Life》,但300 RMB的价格,好像又觉得不值得,一个朋友在地摊上以30 RMB的价格购得一本,到现在好像也没看),此时,影印版又帮了大忙。
     
    所以,一直对英文影印版书的出版心存感激,其功甚伟,善莫大焉!
     
    然而,出版界绝非不食人间烟火而以专布上帝福音为己任,鸡鸣狗盗之徒亦多有之!
     
    80年代,北京希望电脑公司翻译出版电脑技术书籍,应该说解了当时国内技术图书奇缺的燃眉之急,然而其粗制滥造之程度,用“令人咋舌”来形容都觉得太文雅。我有一本关于Ada Compiler的书,躺在书架上已20多年,每拿出来翻一次,都要背过气去:多好的书啊,就这么糟蹋了!
     
    如果说我那本Ada Compiler,是由于译者水平太低,编者没有职业道德,就这么合谋把一本书给糟蹋了的话,现在引进出版英文影印版,技术上应该会成熟很多,不应该再发生这种让人痛心的事情。然而,只是一厢情愿而已……
     
    《.NET设计规范》,原名:Framework Design Guidelines, Conventions, Idioms, and Patterns for Reusable .NET Libraries,机械工业出版社,责任编辑:迟振春,属于“经典原版书库”之一种。
     
    这是我所有影印版书中最粗制滥造的一本,书中的注解框(Annotated Box),原版书中有底纹,影印版中模糊一片,需要在白天光线很好的情况下,集中我那点可怜的视力,才能勉强辨认一个个模糊不清的字母!
     
    该书《出版者的话》中最后一段:

    权威的作者,经典的教材,一流的译者,严格的审校,精细的编辑,这些因素使我们的图书有了质量的保证,但我们的目标是尽善尽美,……
     
    这段话只有前面两个词组(权威的作者,经典的教材)是真的!国人已经习惯了大言不惭!就像那经典的国骂一样,你完全可以充耳不闻,权当放屁!
     
    可是,如果编辑在书印出来之后,只要看上一眼,就一眼,那拿到我手上的就不会是这样了!TMD,什么鸟编辑!56块大洋买回如此的粗制滥造,真TMD!!
     
    影印版书如何制作,我不懂。如果说原书中的段落有底纹而不好印的话,那为什么有些书就做得很好呢?
     
    就手头的影印版书来看,质量从最好到较好的是:
     
    《UML精粹》,原书名:UML DISTILLED,清华大学出版社,责任编辑:居然没有责任编辑!属于“大学计算机教育国外著名教材系列(影印版)”之一种。
     
    封面设计:白底,中间的深绿色块突出书名,点缀的水果让人仿佛闻到了果香。
    内页:纸张的质量说不上很好,但很清爽,英文字体有一种slim的秀美(这种秀美让你在翻书时都会小心翼翼)。即使是带有底纹的段落也印得很清楚。
     
    这本书是在乘车途中看完的,除了叹服Martin Fowler的才气之外,书本身的赏心悦目也让人犹如身处桃园,而非熙熙攘攘的公交车上。
     
    《.NET本质论》,原书名:Essential .NET,中国电力出版社,责任编辑:朱恩从,属于“原版风暴系列”之一种。
     
    这本书的纸张质量很好,文字、图表都很清晰,带有底纹的段落也一样清楚,即使在光线并不很强的情况下也能看清。应该说没有辱没Don Box和他的书。
     
    《ATL技术内幕》,原书名:ATL Internals,科学出版社,责任编辑:李佩乾,属于“UML与面向对象设计影印丛书”之一种。
     
    该书中有大量的带有底纹的代码段落,但仍然印的比较清楚。
     
    其它的一大堆C++影印版书,质量说不上好,但还可以看。
     

    SQL Server 2005数据类型的一点注记

    在SQL Server 2000中,存储大型文本或二进制数据(BLOB)的数据类型有text、ntext、image三种:

    text:用于存储长度不定的大型ANSI文本,最多可达到231-1(2,147,483,647)个字符(character)。

    ntext:用于存储长度不定的大型Unicode文本,最多可达到230-1(1,073,741,823)个字符(character)。由于Unicode以两个字节表示一个字符,所以231-1个字节只能表示230-1个字符。

    image:用于存储长度不定的大型二进制数据,最多可达到231-1(2,147,483,647)个字节(byte)。

    但在SQL Server 2005中,这些数据类型已不推荐使用,在未来的版本中将不再支持。取而代之的分别是varchar(max)、nvarchar(max)、varbinary(max)。这些数据类型为处理大型数据(SQL Server 2005中称为Large-value data types)提供了更好的支持。比如,原来由于不能声明text、ntext和image类型的变量,所以不能在Transact-SQL中处理这些类型的数据。而现在,你可以声明varchar(max)、nvarchar(max)和varbinary(max)类型的变量,从而可以在Transact-SQL中处理大型文本或二进制数据。

    遗憾的是,.NET 2.0中的数据类型并没有做到与SQL Server 2005同步,仍然停留在SQL Server 2000的水平,与text对应的是SqlDbType.Text,与ntext对应的是SqlDbType.NText,与image对应的是SqlDbType.Image,而没有与varchar(max)、nvarchar(max)、varbinary(max)对应的SqlDbType枚举值。

    .NET 3.0是否已与SQL Server 2005同步?尚不清楚。

    May 18

    又回到了全拼输入法

    为了解决中文输入的问题,各路高人各显神通。Windows Server 2003标准配置的输入法就有:内码、全拼、双拼、郑码、智能ABC、微软拼音输入法2003。据说现在研究输入法的仍大有人在!

    一直有一个“顽固”的想法:中文输入应该是一个自然的过程,不应该特意去学。所以对“五笔”一直敬而远之。 

    最早的时候是用的双拼,后来全拼输入法出来后,就一直采用全拼。现代汉语的特点是以“词”为组成单位,而不是“字”,而且,使用全拼可以建立自己的个性化词库。所以,理论上,如果词库足够“好”,则中文输入的速度将足够快。

    微软一直在研究自己的拼音输入法,许多人觉得很好用。趁着这次重装系统,也安装了微软拼音输入法,但今天,我还是把它卸掉了。

    微软拼音输入法采用了人工智能(AI)的机器学习技术,其目的是由机器(软件)辅助人的中文输入,具体体现为三点:

    ①     根据字与字的人工组合自动“组字成词”

    ②     根据字(或词)的使用频度动态调整字/词的出现位置(将使用频度高的字/词自动往前排列)

    ③     “组词成句”

    这看起来很合理,但实际使用中却不尽然。

    首先,“组字成词”需要一个人工“拣字”的过程,无疑降低了输入速度。

    其次,根据字/词的使用频度自动调整出现位置,最易出现错别字!因为人很容易记住某个字/词的出现位置,在随后的输入过程中,在输入完整或部分拼音后,直接按相应的数字键(表示字/词的出现位置的选择键)就可以完成输入,而一旦位置不再固定不变,则很容易输入同音的别字,否则就要在输入每个字/词时都要仔细查看其位置,这样一来,输入速度就可想而知了。

    最后,“组词成句”看起来很完美,但并不实用。因为很少有一句话会到处套用,所以其“复用”程度很低。

    虽然微软拼音输入法有这些问题,但其借助AI技术提高中文输入速度的努力是值得称道的,与之相比,全拼输入法这么多年在技术上却一直没有进步(实际情况不得而知,仅根据Windows上所配置的全拼输入法而言),真是可惜!

    全拼输入法如果在这些方面有所改进,则其fans将有福了:

    ①     完善词库管理

    一直不知道全拼的词库存放在哪里,所以每次重装系统,都会丢失以前所建的词库,又得从头开始一个词一个词地建。后来才知道,原来隐藏在一个很深的目录下,具体位置:

    C:\Documents and Settings\[user]\Application Data\Microsoft\IME\winpy\WINPY.EMB

    重装系统前,备份此文件,然后再恢复,即可。

    如果在词库的管理界面上提供一些管理功能,该有多好!(实现起来并不费事)

    ②     提高软件的适应性与容错能力

    有时候,位于屏幕左下角的全拼功能窗口无法“消隐”,一直固执地出现在那里,非常烦!而且有时候还会出现多个!!而且任何一个输入框都会默认设置为中文输入状态,不胜其烦!!!

    难道这就是为“爱”必须要付出的代价么?

    说起来,也可能是无可奈何罢。微软只对发展自己的拼音输入法有兴趣,而并无意于发展不属于自己的全拼输入法,即使全拼的开发商有意完善,恐怕也是没有办法的罢。

    或许,世界本不完美,要求完美本身就是一个西西弗斯的问题……

    May 15

    looking & flying

    looking and be looked
    looking and be looked
     
    flying in the perfect world
    flying with booked wings in the perfect world
     
    May 05

    关于WebService.htc的一个小问题

    要在IE浏览器中访问Web Services,必须要将webservice.htc以如上的形式嵌入页面中。webservice.htc是Microsoft开发的访问远程Web Services的客户端proxy component。
     
    由于IE7增强了安全方面的设置,有可能会造成webservice.htc不能正常装载。如图所示,要在IE7中正常装载Behavior文件,必须Enable Binary and script behaviors。