วันจันทร์ที่ 17 มกราคม พ.ศ. 2554

ความรู้เกี่ยวกับ search engine

ความรู้เกี่ยวกับ Search Engine

Search Engine คืออะไร


เพื่อเป็นการเจาะลึกเนื้อหาและข้อมูลเกี่ยวกับ Search Engine คืออะไรและรายละเอียดต่าง ๆ ของ Search Engine เพื่อเป็นข้อมูลให้หลาย ๆ ท่านที่ยังไม่ทราบ หรือ กำลังหาข้อมูลจะได้นำไปใช้ให้เกิดประโยชน์ ผมก็เลยได้พยายามรวบรวมข้อมูลต่าง ๆ จากหลายแห่ง เพื่อจะนำมาเขียนบทความชุดนี้

1.Search Engine หมายถึง
Search Engineคือ โปรแกรมที่ออกแบบมาเป็นเครื่องมือสำหรับใช้ค้นหาข้อมูลบนเว็บไซต์ต่างๆ ส่วนใหญ่จะเป็นการค้นหาคำสั้นๆหรือที่เรียกว่า keyword หรือคำค้นต่าง ๆ นั่นเอง ซึ่งข้อมูลนั้นอาจอยู่ในรูปแบบของเว็บไซต์ ไฟล์เอกสาร ไฟล์รูปภาพ สื่อมัลติมีเดียไฟล์บีบอัด และรูปแบบอื่น ๆ ที่สามารถบันทึกเป็นเอกสารออนไลน์ได้ โดยข้อมูลการเก็บรายชื่อเว็บไซต์ และข้อมูลที่เกี่ยวข้องต่างๆ ของเว็บไซต์และนำมาจัดเก็บไว้ใน server เพื่อให้สามารถค้นหาและแสดงผลได้สะดวกและรวดเร็วมากยิ่งขึ้น การทำงานของ Search Engine นั้นจะทำงานก็ต่อเมื่อมีคนป้อนคำหรือที่เรียกว่า keyword ลงไปใน Search Engine นั้นๆจากนั้น Search Engine ก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมาครับ การใช้ search engine ที่ดีนั้นคือการค้นหาข้อมูลที่ตรงและถูกต้องตามที่เราต้องการ

2.ประเภทของ Search Engine
Search Engine มี 3 ประเภท (ในวันที่ทำการศึกษาข้อมูลนี้และได้ทำการรวบรวมข้อมูล ผมสรุปได้?3 ประเภทหลัก) โดยมีหลักการทำงานที่ต่างกัน และ การจัดอันดับการค้นหาข้อมูลก็ต่างกันด้วยครับ เพราะมีลักษณะการทำงานที่ต่างกันนี่เองทำให้ โดยทั่ว ๆ ไปแล้วจะมีการแบ่งออกเป็นหลาย ๆ ประเภทด้วยกัน แต่ที่พอสรุปได้ก็มีเพียง?3 ประเภทหลัก ๆ ดังที่จะนำเสนอต่อไปนี้ครับ
ประเภทที่ 1 Crawler Based Search Engines
Crawler Based Search Engines คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน
โดยมีองประกอบหลักเพียง 2 ส่วนด้วยกันคือ
1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
2. ซอฟแวร์ คือเครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็ก ๆ (ชนิดที่เรียกว่า จิ๋วแต่แจ๋ว) ทำหน้าที่ในการตรวจหา และ ทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำสำเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม Spider หรือ Web Crawler หรือ Search Engine Robots
ตัวอย่างหนึ่งของ Crawler Based Search Engine ชื่อดัง http://www.google.com




Crawler Based Search Engine ได้แก่อะไรบ้าง
จะยกตัวอย่างคร่าว ๆ ให้ได้เห็นกันเอาแบบที่เรา ๆ ท่าน ๆ รู้จักหนะครับก็ได้แก่? Google , Yahoo, MSN, Live, Search, Technorati (สำหรับ blog)?ครับ ส่วนลักษณะการทำงาน และ การเก็บข้อมูงของ Web Crawler หรือ Robot หรือ Spider นั้นแต่ละแห่งจะมีวิธีการเก็บข้อมูล และ การจัดอันดับข้อมูลที่ต่างกันนะครับ เช่น คุณทำการค้นหาคำว่า Search Engine คืออะไรผ่านทั้ง 5 แห่งที่ผมให้ไว้จะได้ผลการค้นหาที่ต่างกันครับ
ประเภทที่ 2 Web Directory หรือ Blog Directory
Web Directory หรือ Blog Directory คือ สารบัญเว็บไซต์ที่ให้คุณสามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมาก ๆ คล้าย ๆ กับสมุดหน้าเหลืองครับ ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่ อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้ อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ซึ่งผมจะขอยกตัวอย่างดังนี้

ODP Web Directory ชื่อดังของโลก ที่มี Search Engine มากมายใช้เป็นฐานข้อมูล Directory 1.? ODP หรือ Dmoz ที่หลาย?ๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยเราด้วยครับ (URL : http://www.dmoz.org/ )
2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย (URL : http://webindex.sanook.com/ )
3. Blog Directory อย่าง BlogFlux Directory ที่มีการเก็บข้อมูลเกี่ยวกับบล็อกมากมายตามหมวดหมู่ต่าง ๆ หรือ Blog Directory อื่น ๆ ที่สามารถหาได้จาก Make Many แห่งนี้ครับ
ประเภทที่ 3 Meta Search Engine
Meta Search Engine คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษา HTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ
ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเอง และ อีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย?ๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร.

3.การใช้งานของ Search Engine
1. การค้นหาในรูปแบบ Index Directory
วิธีการค้นหาข้อมูลแบบ Index นี้ข้อมูลจะมีความเป็นระเบียบเรียบร้อยมากกว่าการค้นหาข้อมูลด้วย วิธี Search Engine โดยมันจะถูกคัดแยกข้อมูลออกมาเป็นหมวดหมู่ และจัดแบ่งแยก Site ต่างๆออก เป็นประเภท สำหรับวิธีใช้งาน คุณสามารถที่จะ Click เลือกข้อมูลที่ต้องการจะดูได้เลยใน Web Browser จากนั้นที่หน้าจอก็จะแสดงรายละเอียดของหัวข้อปลีกย่อยลึกลงมาอีกระดับหนึ่ง ปรากฏขึ้นมาให้เราเลือกอีก ส่วนจะแสดงออกมาให้เลือกเยอะแค่ไหนอันนี้ก็ขึ้นอยู่กับขนาดของฐานข้อมูลในIndex ว่าในแต่ละประเภท จัดรวบรวมเก็บเอาไว้มากน้อยเพียงใด เมื่อคุณเข้าไปถึงประเภทย่อยที่คุณสนใจแล้ว ที่เว็บเพจจะ
แสดงรายชื่อของเอกสารที่เกี่ยวข้องกับ ประเภทของข้อมูลนั้นๆออกมา หากคุณคิดว่าเอกสารใดสนใจหรือต้องการอยากที่จะดู สามารถ Click ลงไปยัง Link เพื่อขอเชื่อต่อทางไซต์ก็จะนำเอาผลของข้อมูลดังกล่าวออกมาแสดงผลทันที นอกเหนือไปจากนี้ เว็ปไซต์ที่แสดงออกมานั้นทางผู้ให้บริการยังได้เรียบเรียงโดยนำเอา Site ที่มีความเกี่ยว ข้องมากที่สุดเอามาไว้ตอนบนสุดของรายชื่อที่แสดง
2. การค้นหาในรูปแบบ Search Engine
               วิธีการอีกอย่างที่นิยมใช้การค้นหาข้อมูลคือการใช้ Search Engine ซึ่งผู้ใช้ส่วนใหญ่กว่า 70% จะใช้วิธีการค้นหาแบบนี้ หลักการทำงานของ Search Engine จะแตกต่างจากการใช้ Index ลักษณะของมันจะเป็นฐานข้อมูลขนาดใหญ่มหาศาลที่กระจัดกระจายอยู่ทั่วไปบน Internet ไม่มีการแสดงข้อมูลออกมาเป็นลำดับขั้นของความสำคัญ การใช้งานจะเหมือนการสืบค้นฐานข้อมูล อื่นๆคือ คุณจะต้องพิมพ์คำสำคัญ (Keyword) ซึ่งเป็นการอธิบายถึงข้อมูลที่คุณต้องการจะเข้าไป ค้นหานั้นๆเข้าไปจากนั้น Search Engine ก็จะแสดงข้อมูลและ Site ต่างๆที่เกี่ยวข้องออกมา
หลักการค้นหาข้อมูลของ Search Enine
               สำหรับหลักในการค้นหาข้อมูลของ Search Engine แต่ละตัวจะมีลักษณะที่แตกต่างกันออกไป ขึ้นอยู่กับว่าทางศูนย์บริการต้องการจะเก็บข้อมูลแบบไหน แต่โดยส่วนใหญ่แล้วจะมีกลไกใน การค้นหาที่ใกล้เคียงกัน หากจะแตกต่างก็คงจะเป็นเรื่องประสิทธิภาพเสียมากกว่า ว่าจะมีข้อมูล เก็บรวบรวมไว้อยู่ในฐานข้อมูลมากน้อยขนาดไหน และพอจะนำเอาออกมาบริการให้กับผู้ใช้ ได้ตรงตามความต้องการหรือเปล่า ซึ่งลักษณะของปัจจัยที่ใช้ค้นหาโดยหลักๆจะมีดังนี้
   1. การค้นหาจากชื่อของตำแหน่ง URL ใน เว็บไซต์ต่างๆ
   2. การค้นหาจากคำที่มีอยู่ใน Title (ส่วนที่ Browser ใช้แสดงชื่อของเว็บเพจอยู่ทางด้าน
               ซ้ายบนของหน้าต่างที่แสดง
               3. การค้นหาจากคำสำคัญหรือคำสั่ง keyword (อยู่ใน tag คำสั่งใน html ที่มีชื่อว่า meta)
               4. การค้นหาจากส่วนที่ใช้อธิบายหรือบอกลักษณะ site

การค้นหาข้อมูลด้วย Search Engine
               1. เปิดเว็บไซด์ที่ให้บริการ
               2. ใส่คำ (keyword) ที่คุณต้องการจะค้นหาลงไปในช่องยาวๆ (text box) ที่มีสร้างเอาไว้ให้
               3. คลิ๊กที่ปุ่ม ค้นหา (กรณีเลือก Search Engine ที่อื่นอาจจะไม่ได้ใช้คำนี้ก็ได้ แล้วแต่ที่คุณเลือก 
               โปรแกรมจะเริ่มค้นหาคำนั้นๆให้ ตอนนี้คุณก็รอสักพักนึงก่อน จากนั้นรายชื่อของเว็บเพจต่างๆ ที่เกี่ยวข้องกับข้อมูลที่ระบุจะถูกแสดงออกมาในรูปแบบของลิ้งค์พร้อมคำอธิบายประกอบนิดหน่อย ให้เราอ่านเพื่อใช้ในการตัดสินใจว่ามันเกี่ยวข้องกับข้อมูลที่เราต้องการหรือเปล่า ส่วนใหญ่ข้อมูลที่พบมีมากจนเกินกว่าที่จะแสดงให้เห็นหมดในหน้าเดียว มันจะมีตัวแบ่งหน้าให้เราทางด้าน ล่างสำหรับเลือกไปดูรายละเอียดส่วนอื่นๆที่เหลือในหน้าถัดๆไป แต่โดยมากแล้วข้อมูลที่ใกล้เคียง กับคำที่เราต้องการมากที่สุดจะอยู่ในช่วงต้นๆ ของรายการแรกที่ Search Engine นั้นๆตรวจพบ                           
               นอกจากการค้นหาข้อมูลแล้ว Search Engine บางที่ ยังสามารถค้นหา รูปภาพ ได้อีกด้วยครับ
การค้นหาด้วยวิธี Search Engine นั้นมักจะได้ผลลัพธ์ออกมากว้างๆชี้เฉพาะเจาะจงได้ยาก บางครั้งข้อมูลที่ ค้นหามาได้อาจมีถึงเป็นร้อยเป็นพัน Site แล้วมีใครบ้างหละที่อยากจะมานั้งค้นหาและอ่านดูที่จะเพจ ซึ่งคง ต้องเสียเวลาเป็นวันๆแน่ซึ่งก็ไม่รับรองด้วยว่าคุณจะได้ข้อมูลที่คุณต้องการหรือไม่ ดังนั้นจิงมีหลักในการค้น หา เพื่อให้ได้ข้อมูลใกล้เคียงความเป็นจริงมากที่สุด
ค้นหาคำในหน้าเว็บเพจด้วย Browser
               การค้นหาคำในหน้าเว็บเพจนั้นจะใช้สำหรับกรณีที่คุณเข้าไปค้นหาข้อมูลที่เว็บเพจใด เว็บเพจหนึ่ง แล้วภายในมีข้อความปรากฏอยู่เต็มไปหมด จะนั่งไล่ดูทีละบรรทัดคงไม่สะดวก ในลักษณะนี้เราใช้ใช้ browser ช่วยค้นหาให้ คือ
1.                        ขึ้นแรกให้คุณนำ mouse ไป click ที่ menu Edit
               2. แล้วเลือกบรรทัดคำสั่ง Find (on  This Page) หรือกดปุ่ม Ctrl + F ที่ keyboard ก็ได้
               3. จากนั้นใส่คำที่ต้องการค้นหาลงไปแล้วก็กดปุ่ม Find Next โปรแกรมก็จะวิ่งหาคำดังกล่าว หากพบมันก็จะกระโดดไปแสดงคำนั้นๆ ซึ่งคุณสามารถกดปุ่ม Find Next เพื่อค้นหาต่อได้ อีกจนกว่าคุณจะพบข้อมูลที่ต้องการ
               ข้อแตกต่างระหว่าง Index และ Search Engineคำตอบก็ คือวิธีในการค้นหาข้อมูแบบ Index เค้าจะใช้คนเป็นผู้จัดรวบรวมและทำระบบฐานข้อมูลขึ้นมา ส่วนแบบ Search Engine นั้นระบบฐานข้อมูลของมันจะได้รับการจัดสร้างโดยใช้ Software ที่มีหน้าที่เกี่ยวกับงานทางด้านนี้โดยเฉพาะมาเป็นตัวควบคุมและจัดการ ซึ่งเจ้า Software ตัวนี้จะมี ชื่อเรียกว่า Spiders การทำงานข้องมันจะใช้วิธีการเดินลัดเลาะไปตามเครือข่ายต่างๆที่เชื่อมโยงถึงกันอยู่เต็มไปหมดใน Internet เพื่อค้นหา Website ที่เกิดขึ้นมาใหม่ๆ รวมทั้งยัง
สามารถตรวจสอบหาความเปลี่ยนแปลงของ ข้อมูลใน Site เดิมที่มีอยู่ ว่าที่ใดถูกอัพเดตแล้วบ้าง จากนั้นมันก็จะนำเอาข้อมูลทั้งหมดที่สำรวจเข้ามา ได้เก็บใส่เข้าไปในฐานข้อมูลของตนอัตโนมัติ ยกตัวอย่างของผู้ให้บริการประเภทนี้เช่น Excite , googleเป็นต้น
ข้อมูลจาก http://www.kemapat.ac.th/searchengine.htm
              
               4.Web Search Engine ของไทยและต่างประเทศ
ตัวอย่าง Search Engine ของไทย

1.Yahoo  
2.Sanook
3. Catcha 
4.Lemon online
5.Thai search
6.siamguru
     แนวโน้มของการพัฒนา search engine ในไทย จะมีความเข้มข้น ขึ้นครับ กล่าวคือ จะมีการพัฒนาเพื่อให้ผลการค้นหามีความแม่นยำสูงขึ้น และยังมีการใช้ เทคโนโลยีคลัสเตอร์ (Distributed and Parallel computing) [3] มาเพิ่มประสิทธิภาพในการค้นหาให้มีความรวดเร็วสูงขึ้น และยังมีการเพิ่มจำนวนเว็บเพจที่เก็บได้ เป็นหลักร้อยล้าน หรือพันล้าน

ของต่างประเทศ
ตัวอย่างของ search engine ของต่างประเทศ

1.Google
2.Altavista
3.Yahoo.com
4.Lycos


ข้อมูลอ้างอิง
http://www.it-guides.com/lesson/search_engine_01.html
http://www.nectec.or.th/courseware/internet/web-tech/0021.html
http://gotoknow.org/blog/bow
http://truehits.net/faq/f_stat.php
http://www.keng.com/?p=64


ไม่มีความคิดเห็น:

แสดงความคิดเห็น