中文马克思主义文库      【参考】“文库录入标准(征求意见稿)”旧稿

中文马克思主义文库

志愿者须知


★ 文库的资料整理工作
★ 文库对志愿者的提醒
  一、关于选材
  二、关于重新校对
  三、关于文献整理
   (一)以统一“查找”、“替换”来提高校对、修改的效率
   (二)对文献中原有的错字的处理
   (三)录入时应注意的几点:
      1)着重号
      2)注解/脚注编号问题
      3)制作表格的方法
   (四)其他


★ 文库的资料整理工作


  文库的资料整理工作包括:
  · 翻译——基本要求:认真;文字通顺;意思清楚明白。翻译新手可以多揣摩优秀的译本来自我提高;
  · 扫描——需要有扫描仪的志愿者来做;
  · 收集、整理——其他网站已有上载电子书,或已制作成网页,可予收集和转载(参见“文库对志愿者的提醒”第二点);
  · 录入——主要针对没有扫描版,或扫描效果不佳的文献;完全手工录入易于出错,漏字、漏段时也难以察觉,所以录入完应认真校对一次。
  · 校对——已有PDF电子书的文献,首先选择通过OCR将之转化为文字版,再进行校对。志愿者如不熟悉,可提请文库帮忙;
  · 制作网页和电子书——欢迎懂得网页制作的志愿者;
  等等。
  文库读者(尤其是志愿者)如果发现文库网页上的错字或其它问题,请不吝告知。深表感谢!
  不论如何,我们希望所有的志愿者都能做到:1、认真(宁可放慢速度);2、及时与文库编辑沟通。



★ 文库对志愿者的提醒


 一、关于选材


  (一)欢迎不同倾向——比如倾向无政府主义等等;倾向政治经济学等等——的志愿者参与文库工作。
  志愿者可以根据自己的兴趣、专长和倾向,选择自己参与整理的资料;可参考“待整理文献一览表”;也可以提出自己认为值得整理上传的文献;但请事先告知文库编辑,并及时沟通,以避免重复劳动,或无效劳动(例如重复翻译或录入某文献)。

  (二)志愿者对自己感兴趣的、想要录入(或翻译等)的文献,应事先在网上搜索有无其他人已做好的文字版。例如,《马克思恩格斯全集》《列宁全集》《中共中央文件选集》(1921年—1949年9月)等,都已有文字版,马库也在陆续整理中。某些中共领导人的文献已有文字版的《文选》或《文集》PDF的。这些文献不需录入,只要一定的整理、 更正少量错字、制作 图片、表格和网页的工作。
  在上列文件中,志愿者可提出较为重要、应整理上传的篇目,告知马库。马库认为值得的,即可提前整理上传。如果有志愿者懂得网页制作,能按标准格式制作上传网页的话,也可以申请参与分工合作,以加快整理上传的进度。

 二、关于重新校对


  如果志愿者录入、校对后的文献中仍有较多错误,文库可能要求志愿者再校一次。也有网页已经做好,志愿者自己又提出重校一遍的情况。
  重校者应当事先与文库沟通,尤其在网页已制作、上传的情况下。因为该文献可能已进一步整理成适合制作成网页的格式,甚至已校正了部分错误。为避免重复劳动,此时应由文库发给志愿者新版本,在此基础上重新校对。

 三、关于文献整理


  (一)OCR出来的文本,特别是原文件为繁体版的,很可能存在大量同样的错误(例如“马克思”被OCR成“焉克思”,“资本”被OCR成“资木”或“查本”)。可以统一进行“查找”、“替换”,也就是把“焉克思”统一替换成“马克思”,等等 ,以提高效率,不必逐个手动更改。

  (二)发现文献中有很容易确定的错字,可以直接改掉(如‘白由’可直接改成‘自由’)。如果是疑似的错字,漏字,或不通顺之处,不应擅自更动,可加上‘录入者注’来说明,例如:“19月【按上下文推断,此处应为10月之误。——录入者注】”。

  (三)志愿者提交的文本,大多数是使用word文件直接录入,并设定标题、小标题、粗体、下划线等格式。兹请注意如下几点:

  1)如果正文中使用黑体、楷体、在文字下划点划线等作为强调着重号),那么——
    假如只用上一种,一般来说统一以文字加粗来表示即可;
    如果正文中同时使用黑体、下划点(线),则前者可以用文字加粗来代替,后者采用下划线

  2)注解/脚注编号问题。这是负责录入、校对的志愿者应当特别关注的一个问题。

  有的文章的第一个注解,是对文章写作背景和相关情况的说明,录入时可以不作为注释,直接放在正文之前。

  如果实体书中只采用一种注解/脚注编号——不管是在每页的下方,文章末尾,还是书末——则请统一使用数字中括号(如“[1][2][3]”。不要使用小括号“(1)(2)(3)”或“①②③”,否则,将会无谓地大大增加网页制作者的工作量。其次,也可采用word本身提供的脚注功能(即“插入(O)”→“引用(N)”→脚注和尾注(G))。如果脚注编号使用的是*,**,***字符,可原样保留。书中其它用到中括号之处,请使用全角字符([ ])。

正文中的脚注——

在那些使资产阶级、贵族和可怜的倒退预言家惊慌失措的现象当中,我们认出了我们的好朋友、好人儿罗宾[1] ,这个会迅速刨土的老田鼠、光荣的工兵——革命。

脚注——

[1] 好人儿罗宾是英国民间故事中庇护人们和为人们帮忙的幻想人物,是莎士比亚的喜剧“仲夏夜之梦”中的主要人物之一。——第4页。

  文献中成段引用的文字,前后加上<quote></quote>。例如以下例子中第二段是“引文”:

  于是他为了替“全人类保留”这个“不可让渡的公共财产”就接受了民族改良派的计划:“每一个农民,不管来自哪一个国家,都分给他160英亩的美国土地供其维持生活。”在该报第14号上所载的“答孔策”一文中,这个计划是这样说明的:

  <quote>“任何人均不得从这一尚未动用的国民财产中领取160英亩以上的土地,而且领取这160英亩也只能限于自耕。”</quote>

  有的著作同时采用几种注释方法。例如《马克思恩格斯全集》中,既有每页下的注释,也有书末汇总的注释。文库的做法是:对书末的注释统一采用“[1][2][3]……”,每页下的注释,则定义为深绿色及较小字体,直接在文中相应地方插入,如“这种材料是从所谓官房学——各种知识的杂拌,满怀希望的[注:第3版和第4版中是:毫无希望的。——编者注]德国官僚候补者必须通过的炼狱之火——抄袭来的。”。
  但这种方法也有弊端:当注释太长的时候,容易使正文被割断得厉害,读者无法连贯阅读。因此,志愿者在整理时,也可以采用另一种办法,即把正文每页下的注释放在所属段落之后。例如:
  这种材料是从所谓官房学——各种知识的杂拌,满怀希望的①德国官僚候补者必须通过的炼狱之火——抄袭来的。

① 第3版和第4版中是:毫无希望的。——编者注。



  3)制作表格的方法:
    ① 各列之间“用Tab制表键对齐文本”;
    ② 使用空格键来隔开,但需要对齐;
    ③ 在Word、Excel等软件中制作表格并录入;
    ④ 对于繁复的、难以制作的表格,可以直接以截图代替(比如利用QQ的截图功能,将截下的图片“另存”)。

  (四)个别志愿者希望“最大限度地保存原版本的面貌”,例如把“共产党宣言”录入为“言宣黨產共”。我们的建议是:保存原貌的最好方式就是图片,或扫描成PDF。既然制作成文字版,这种“保存原貌”就只能增加阅读障碍。如果原件很有价值,可考虑同时上传文字版和PDF电子书。