Wednesday, February 29, 2012

Bu hafta radarima takilanlar - 3 link (httpie, gravity, arya)

Bu hafat sunlar gozume carti ve inceledim

Python-powered HTTP CLI for humans : https://github.com/jkbr/httpie
Gravity unlocks the Interest Graph : http://www.gravity.com/
Mongodb Power web search index : https://github.com/SupermanScott/Arya
Optimizing Object IDs : http://www.mongodb.org/display/DOCS/Optimizing+Object+IDs

Monday, February 27, 2012

Derhal Macport'tan Hombrew'e Gecin

Macports ile paket yonetmek degil paket karistirmak mumkun oluyor sadece.
Silmesi de ayri dert olabiliyor. Henuz Macports ile hic bir paket kurmasaniz da bir takim bagimliliklari yuzunden silinmeyebiliyor su sekilde bir "-f" parametresi ile force edebilirsiniz.

sudo port -f uninstall installed

Tamamen silinmesi icin


sudo rm -rf /Applications/DarwinPorts
sudo rm -rf /Applications/MacPorts
sudo rm -rf /Library/LaunchDaemons/org.macports.*
sudo rm -rf /Library/Receipts/DarwinPorts*.pkg
sudo rm -rf /Library/Receipts/MacPorts*.pkg
sudo rm -rf /Library/StartupItems/DarwinPortsStartup
sudo rm -rf /Library/Tcl/darwinports1.0
sudo rm -rf /Library/Tcl/macports1.0
sudo rm -rf ~/.macports

silmeli ve son olarak dikkatlice ve yedeklerinizi alarak!!!
sudo rm -rf /opt/local
 de kalan dosyalari da silmeli

ve sonunda                    


Ardindan da derhal homebrew e merhaba
/usr/bin/ruby -e "$(curl -fsSL https://raw.github.com/gist/323731)"


Irdeleyin : https://github.com/mxcl/homebrew/wiki/installation

Sunday, February 26, 2012

Sayfa Istatistiklerinde Neden MongoDb Kullanmali

Istatistik verileri icin ihtiyaciniz olan sey hizli bir yazma islemi ve bolca disktir ;)

Disk konusunda kolay genisletilebilmesi ve distrubuted yapisinin kolay kontrol edilmesinin yani sira su uc madde yuzunden sayfa goruntuleme gibi istatistiklerinizi MongoDb'de kullanmaniz icin iki temel neden

  • select - edit - update seklinde bir kullanimdansa $inc ile tek islem yapmaniz yeterlidir. Tek baglanti tek islem tek update. Klasik yontemle de tek insert yaparak devasa buyuklukte gunluk loglar olusturabilirsiniz tabi ardindan bunlari islersiniz. Neden olmasin. Ancak mongodb $inc performansindan vazgecmek istemezsiniz. 
  • write islemleri asenkron gerceklestiginden oldukca hizli gerceklesecektir ve loglama hizini dusurmeyecektir.

Sunday, February 19, 2012

MongDb Disk Temizligi

Ozellikle disk alaninizin neredeyse yarisini kaplayan bir veritabaniniz varsa collection sildiktan sonra mutlaka
db.repairDatabase()

calistirmayi unutmayin yoksa bos yere sildiginiz collection icin ayrilmis alan diskinizde yer kaplayacak.

Mevzu uzerine sunu da okuyun tabi http://www.mongodb.org/display/DOCS/Excessive+Disk+Space

Tuesday, February 14, 2012

David Zuelke : Large-Scale Data Processing With Hadoop and PHP

Kabaca map reduce nedir sorusunu sorduysaniz once bu linkBu sunum da David Zuelke'nin son 6 aydir her konferansta sundugu ve benim de cok begendigim bir cirpida Hadoop-PHP sunumu : Large-Scale Data Processing With Hadoop and PHP (PHPBNL2012 2012-01-27)
View more presentations from David Zuelke

MongoDb ile Aşırı Disk Kullanımı ve Sonrasında Optimizasyon

Senaryomuz su :
MongoDb diskiniz %88 doldu. Makineye yeni bir dik takamiyorsunuz. Gereksiz buyuk boyutlu collectionlar var ve siz bu gereksiz collection'lari sildiniz.
db.col1.drop()
db.col2.drop()
db.col3.drop()
Veri buyuklugunun neredeyse yaridan fazlasini sildiginizi dusunurken hala %88 doluluk orani sizi sasirtti zira mongodb bir takim disk ve indexleme performansi kurallari geregi sildiginiz datanin kapladigi alani diskte hala ayrilmis olarak tutar. Bunun icin collection'lari silmeden once bosaltip ardinddan db.col1.runCommand("compact") calistirmaniz gerekirdi ama artik silindi ve bunu calistirinca hata veriyor (ve tabiki ayni adda bos bir collection acip calistirmak anlamsiz olacaktir).
Bu durumda veri tabanina repair komutu vermek gerekecek ancak bu da kullanimda olan disk alanini kadar bos alana ihtiyaca ihtiyac duyacaktir ve hata verecektir. Bu durumda yapilmasi gereken sey (eger bir disk ekleyemiyorsaniz) elinizdeki var olan datasinin gercekte diskin yarisindan kucuk bir alana sigdigini dusundugunuz veritabanina :

1. db.copyDatabase("db1","db1back") 
2. use db1 
3. db.dropDatabase() 
4. db.copyDatabase("db1back","db1") 
5. use db1back 
6. db.db1() 

19G lik veri icin ortalama yarim saat surdugunu ve hakli olarak bu sirada gelen insert ve find komutlarina cevap vermedgini de ekleyim.

Ek olarak okunmalidir  ki  http://www.mongodb.org/display/DOCS/Excessive+Disk+Space

BOM is evil

\ufeff olarak da kendini gosterebilir tabi. Baş gizli düşmanınızdır unutmayın derim.
Özellikle de bir çeşit api hizmeti veriyorsanız "utf8" i BOM'suz kaydedin aksi halde servisinizden faydalanacak olan istemciler size bolca invalid format hatasi bildirir (xml veya json).
Siz de çıktılarınızı doğru gönderdiginizi iddia edip hatanin kaynagini aradikca beyhude bir ugras isine girmis olursunuz.
Siz daima UT-8 kaydederken BOM'suz kaydedin

Konuyu irdeleyin
BOM : http://en.wikipedia.org/wiki/Byte_order_mark
Unicode : http://en.wikipedia.org/wiki/Unicode
UTF-8 : http://en.wikipedia.org/wiki/UTF-8