หลักการทำงานของ Search Engine
1. ฐานข้อมูลของตนเองที่มีระบบการประมวลผลและจัดอันดับการค้นหา
2. ระบบซอฟแวร์ ที่จะอาศัยโปรแกรมตัวเล็กๆ ของ Search Engineนั้นๆ โดยใช้ในการเก็บหรือสำเนาข้อมูลหน้าเพจใหม่ๆซึ่งโดยทั่วไปมักเรียกว่า Web Crawler หรือ Spider หรือ Search Engine Robots
โดยที่ Search Engine Spider แต่ละแห่งจะมีประสิทธิภาพในการเก็บข้อมูล ไม่เหมือนกันควรระวังและหลีกเลี่ยงในเรื่องของเว็บไซต์ ที่ต้องมีการดึงข้อมูลของเนื้อหาจาก Database แบบDynamic Page ซึ่งจะทำให้แมงมุม ทำการเก็บข้อมูลของเว็บไซต์ได้อย่างไม่ทั่วถึง เจ้าแมงมุมที่ว่านี้ จะคลืบคลาน (Claw ) ไปทุกเว็บไซต์ในอินเตอร์เน็ตที่มันตรวจพบ โดยจะเน้นการมองหาเว็บไซต์ใหม่ๆเนื้อหาใหม่ๆ หรอแม้กระทั่งหน้าเว็บเดิม ที่มีการปรับปรุง เนื้อหาใหม่ (Update Content)
ข้อแตกต่างระหว่าง Index และ Search Engine
คำตอบก็ คือวิธีในการค้นหาข้อมูลแบบ Index เค้าจะใช้คนเป็นผู้จัดรวบรวมและทำระบบฐานข้อมูลขึ้นมา ส่วนแบบ Search Engine นั้นระบบฐานข้อมูลของมันจะได้รับการจัดสร้างโดยใช้ Software ที่มี หน้าที่เกี่ยวกับงานทางด้านนี้โดยเฉพาะมาเป็นตัวควบคุมและจัดการ ซึ่งเจ้า Software ตัวนี้จะมี ชื่อเรียกว่า Spiders การทำงานข้องมันจะใช้วิธีการเดินลัดเลาะไปตามเครือข่ายต่างๆที่เชื่อมโยงถึงกันอยู่เต็มไปหมดใน Internet เพื่อค้นหา Website ที่เกิดขึ้นมาใหม่ๆ รวมทั้งยังสามารถตรวจสอบหาความเปลี่ยนแปลงของ ข้อมูลใน Site เดิมที่มีอยู่ ว่าที่ใดถูกอัพเดตแล้วบ้าง จากนั้นมันก็จะนำเอาข้อมูลทั้งหมดที่สำรวจเข้ามา ได้เก็บใส่เข้าไปในฐานข้อมูลของตนอัตโนมัติ ยกตัวอย่างของผู้ให้บริการประเภทนี้เช่น Excite , Lycos Infoserch เป็นต้น การค้นหาด้วยวิธี Search Engine นั้นมักจะได้ผลลัพธ์ออกมากว้างๆชี้เฉพาะเจาะจงได้ยาก บางครั้งข้อมูลที่ ค้นหามาได้อาจมีถึงเป็นร้อยเป็นพัน Site แล้วมีใครบ้างหละที่อยากจะมานั้งค้นหาและอ่านดูที่จะเพจ ซึ่งคง ต้องเสียเวลาเป็นวันๆแน่ ซึ่งก็ไม่รับรองด้วยว่าคุณจะได้ข้อมูลที่คุณต้องการหรือไม่ ดังนั้นจิงมีหลักในการค้น หา เพื่อให้ได้ข้อมูลใกล้เคียงความเป็นจริงมากที่สุด
หลักเบื้องต้นของการสืบค้น
1. รู้จักที่อยู่ของ Website ที่ให้บริการสืบค้น
2. รู้จักวิธีการค้น
3. รู้จักวิธีการอ่านผลการสืบค้น
4. รู้จักวิธีการจัดเก็บผลการสืบค้น
5. รู้จักวิธีการเผยแพร่การสืบค้น
การสืบค้น คืออะไร
“การสืบค้น” หมายถึง การสืบเสาะค้นหาเรื่องใดเรื่องหนึ่ง
ซึ่งอาจจะได้รับคำตอบในรูปของบรรณานุกรม ต้นฉบับเอกสาร
คำตอบที่เฉพาะเจาะจง ตัวเลข หรือข้อความของเรื่องนั้น
ในที่นี้จะหมายถึงการสืบค้นข้อมูล โดยระบบเครือข่ายอินเทอร์เน็ต ซึ่งการสืบค้นอาจจะพบทั้งเนื้อหาที่เป็นข้อความ แฟ้มเอกสาร ไฟล์รูปภาพ ภาพเคลื่อนไหว
เสียง เป็นต้น
