Saturday, July 30, 2011

Çalınan JSTOR dökümanlarından çıkan istatistiksel veriler ile ne yapılır

Geçen haftalarda 18,592 JSTOR makalesi "çalınmıştı" ve bir çok torrent listesinde yerini almıştı. Bu kadar fazla dokuman kitlesini ustelikte duzensiz bir sekilde paketlenmis bir kalabalıgı indirmek kimin işine yarar diye ben de düsünmedim degil. Tabi olayın özünde 'bilimsel calismalar satılamaz' ilkesi vardi.

Ancak mkrecny bunlarla güzel bir istatistik çıkarmış.

  • Ortalama cümle uzunluğu daha kısa olan dokümanlar daha fazla alıntılanmış.
  • Daha az unique kelime içeren dokümanlar  daha fazla alıntılanmış.
  • Daha fazla alfadebik olmayan semboller içeren (rakamlar dahil) dokumanlar daha fazla alıntılanmış.


meseleyi irdeleyin : mkrecny.com/entry/15/

No comments: