Энэ блогоос хайх

Thursday 19 May 2011

Хайлтын системийн үндэс - Lucene

Lucene нь Doug Cutting-ны бичсэн, гүйцэтгэл өндөртэй, бүх төрлийн чадварыг агуулсан, нээлттэй эхийн, жава хэл дээр бичигдсэн текст хайлтын энжин API юм. Lucene нь API болохоос эппликэшн биш гэдгийг анхаарах хэрэгтэй. Энэ юу гэсэн үг вэ гэхээр текстийг хайхад шаардагдах бүх хүнд ажлуудыг уг API хийж өгөх ба харин түүнийг ашиглах бага зэргийн код бичих ажил л танд үлдэж байна гэсэн үг. Энэ л танд ногдож буй ажил бөгөөд бусад энгийн хайлтын энжин эппликэшнүүдээс ялгаатай нь чиний хэрэгцээнд тохирсон хайлтын эппликншнийг бичихэд шаардагдах мянга түмэн ажилд зарцуулах цаг, хөдөлмөрийг чинь багасгаж өгнө. Тэгээд чиний хэрэгцээ шаардлагад нийцсэн хайлтын эппликэшнийг хялбархан хөгжүүлж болно. 


Lucene нь 4 жишээ классаас бүрдсэн байдаг ба эдгээрийн учрыг л олоод авчихбал Lucene-ыг ашиглахад хялбар байх болно.
  1. FileDocument
  2. IndexFiles
  3. SearchFiles
  4. DeleteFiles
Lucene-ы классууд нь хоорондоо хэрхэн холбоотой болохыг диаграммаар үзүүлэхийг оролдоё.


Index
  Document1
    FieldA(name/value)
    FieldB(name/value)
    ...


  Document2
    FieldA(name/value)
    FieldB(name/value)
    ...


 За дараагийн бичлэгт үргэлжлүүлнээ.

No comments: