logo CBCE Skill INDIA

Welcome to CBCE Skill INDIA. An ISO 9001:2015 Certified Autonomous Body | Best Quality Computer and Skills Training Provider Organization. Established Under Indian Trust Act 1882, Govt. of India. Identity No. - IV-190200628, and registered under NITI Aayog Govt. of India. Identity No. - WB/2023/0344555. Also registered under Ministry of Micro, Small & Medium Enterprises - MSME (Govt. of India). Registration Number - UDYAM-WB-06-0031863

Google কাজ করে কীভাবে?


Google -এ একটি মাত্র শব্দ, বা কখনো  একটি বাক্য লিখে সার্চ করি আমরা। মাত্র কয়েক ন্যানো সেকেন্ডে লক্ষ লক্ষ রেজাল্ট চলে আসে আমাদের সামনে। কি করে Google Search Result দেখায়? আপনার মনেও নিশ্চয়ই গুগল কাজ করে কিভাবে এই প্রশ্ন রয়েছে। নিশ্চয়ই জানতে চান, এত দ্রুত Google সকল প্রশ্নের উত্তর জানে কিভাবে!

Internet ব্যবহার করে কিন্তু গুগলের নাম শুনেনি এমন মানুষ খুঁজে পাওয়া কঠিন, তবে তথ্য অনুসন্ধানে কিন্তু Google ছাড়াও বিভিন্ন সার্চ ইঞ্জিন রয়েছে যেমন- Yahoo, bing, duckduckgo ইত্যাদি। এগুলো নিজ নিজ স্বকীয়তার জন্য জনপ্রিয় এবং সার্চ ইঞ্জিন হিসেবে প্রসিদ্ধ। যদিও জনপ্রিয়তার দিক থেকে বর্তমানে গুগলের আশেপাশেও নেই অন্য কোন সার্চ ইঞ্জিন।

Google Search Result যদিও চোখের পলকে চলে আসে, তব পেছনের গল্পটা কিন্তু অনেক জটিল। প্রায় 99 হাজার কর্মী রাত দিন উন্নত সার্চ রেজাল্ট দেওয়ার জন্য গুগলের হয়ে কাজ করছে। তবে গুগল কিন্তু ম্যানুয়ালি কাজ করেনা। Google Search Result দেখাতে পুরো কাজ সম্পন্ন হয় 3টি জটিল প্রক্রিয়ার মাধ্যমে। চলুন Google যেভাবে কাজ করে সেই তিনটি ধাপ সম্পর্কে জেনে আসি।

“Search Engine”

প্রথমেই জেনে নেওয়া ভাল, Search Engine কী?  আমরা সবাই প্রতিনিয়ত বিভিন্ন কাজে Search Engine ব্যবহার করে অভ্যস্ত, তবুও জিনিসটি কী সে ব্যাপারে অনেকেরই পরিষ্কার ধারণা নেই। সহজ ভাষায় বলতে গেলে, Search Engine হল এক ধরনের সফটওয়্যার সিস্টেম যা World Wide Web (WWW)-এর অন্তর্ভুক্ত সাইটগুলো থেকে তথ্য খুঁজে বের করতে সাহায্য করে আমাদের। সার্চ ইঞ্জিনের মাধ্যমে কোন ঠিকানা না জেনেই অনেক সহজে প্রয়োজনীয় তথ্য বা ওয়েবসাইট খুঁজে পাওয়া যায়। এজন্যই Internet ব্যবহারকারী এবং ওয়েব ডেভেলপারদের কাছে Search Engine -এর গুরুত্ব অপরিসীম।

Search Engine হিসেবে যেকোন প্রশ্নের উত্তর খুজে বের করার সাথে গুগলের তিনটি কাজ জড়িত। অর্থাৎ, গুগল কিভাবে কাজ করে তা জানতে হলে প্রথমেই আমাদের সার্চ ইঞ্জিনের তিনটি কৌশলের সাথে পরিচিত হতে হবে-

Web Crawling.

Web Indexing এবং

Page Rank.

Web Crawling:

Web Crawling কে Web Spider ও বলা হয়। প্রতিদিন, প্রতি সেকেন্ডে অসংখ্য ওয়েবসাইট তৈরি হচ্ছে। নতুন নতুন অসংখ্য কন্টেন্ট পাবলিশ হচ্ছে। এতো এতো কন্টেন্ট এবং ওয়েবসাইটের মধ্যে, কোনটি আপনি সার্চ করছেন, তা কিন্তু গুগল তৎক্ষণাৎ বের করেনা। নতুন ওয়েবসাইট তৈরি করার পর, সেটিকে গুগলের Console Site-এ Entry দিতে হয়। আপনি যদি একটি ওয়েবসাইট এর ওনার হয়ে থাকেন, আপনার সাইট টি ইউজার দের কাছে ভিজিবল হবে না। যদি না এটি গুগলের Console Site-এ Entry দেওয়া হয়।

এবার আসি Crawling -এর ব্যাপারে। গুগলের একটি Robot Software রয়েছে, যার নাম Google Bot. এই Robotটি,  তার Console -এ লিস্ট কৃত সকল ওয়েবসাইট স্ক্যান করে। বা Crawling করতে থাকে। Google Bot প্রথমে একটি ওয়েবসাইটের একটি লিঙ্কে প্রবেশ করে। এরপর সেখানে যতো link, hyperlink রয়েছে, সবগুলোতে ভিজিট করে। সাথে ক্রমাগত Crawling  এর কাজ চলতেই থাকে। এভাবে, ইন্টারনেটের সকল লিঙ্ক সংগ্রহ করে গুগল। এক্ষেত্রে, কিছু লিঙ্ক হয়তো রিপিট হতে থাকে। তখন রিপিট লিঙ্ক গুলোকে বাদ দিয়ে দেওয়া হয়। তার মানে , একটি লিঙ্ক শুধু একবারই সংগ্রহ করে Google Bot.

আবার, এই Crawling এর কাজটি কিন্তু অনেকটা পেইজ রিফ্রেশ করার মত। অর্থ্যাৎ, একবার Crawling করা শেষ হলে, কিছুক্ষন পর গুগল বট আবারো সবগুলো ওয়েবসাইটে ঘুরে আসে। নতুন কোনো কন্টেন্ট পাবলিশ হল কিনা, বা কোনো লিঙ্ক পরিবর্তন হলো কিনা, তা সবসময়ই মনিটর করা হচ্ছে। Web Crawling থেকে প্রাপ্ত লিঙ্ক গুলো এবার Indexing করার পালা।

Web Indexing:

Index শব্দের অর্থ সূচিপত্র। অর্থ্যাৎ, Crawling করে যেই লিঙ্ক গুলো সংগ্রহ করেছিলো, Google Bot এবার সেগুলোকে সাজিয়ে রাখে। আমরা যখন কোনো কিছু সার্চ করি, গুগল তখন, এই ইনডেক্স থেকে রিলেটেড Keyword খুঁজতে থাকে। এবং সেগুলোই রেজাল্ট হিসেবে শো করে। এই খুঁজে বের করাটাই হলো সার্চিং।

page Rank:
 

এবার আসি সবচেয়ে গুরুত্বপূর্ণ বিষয়ে। যেই Algorithm-এর মাধ্যমে, গুগল আজ সার্চ ইঞ্জিন হিসেবে এতটা সফলতা পেয়েছে, সেটি হল Page Rank. Google-এর Search Bar এ কোনো শব্দ লিখে Search করলে, অসংখ্য রেজাল্ট শো করে। এর মধ্যে কিছু রেজাল্ট একেবারে প্রথম পেইজে শো করে। কোনোটি আবার দ্বিতীয় বা তৃতীয় পেইজে। অনেক লিঙ্কে তো আমরা কখনো প্রবেশই করিনা। কারণ সেগুলো Rank করেনা। এই Ranking শব্দটির সাথে তো সবারই পরিচিতি থাকার কথা। বিশেষ করে ব্লগার দের এই বিষয় নিয়ে অনেক বেশি ভাবতে হয়।

Google তার ইনডেক্স থেকে লিঙ্ক তো খুঁজে বের করলো। কিন্তু কোন লিঙ্কটি আপনাকে সবার আগে শো করবে? যেই লিঙ্কটি Rank করবে। অর্থ্যাৎ, আমরা গুগলে তথ্য খুঁজি। এই তথ্য গুলো থাকে বিভিন্ন ওয়েবসাইটে পাবলিশ হওয়া Content-এর মধ্যে। যেই Content-এ, আমাদের Search করা Wordটি সম্পর্কে সবচেয়ে ভালো ভাবে উত্তর দেওয়া হয়েছে, সবচেয়ে বেশি বার শেয়ার করা হয়েছে, যেটিতে ভিজিটর অনেক বেশি এবং সবচেয়ে বেশি সময় ধরে পড়া হবে, সেটির থাকবে Ranking এর সবার প্রথমে। গুগল প্রায় ২০০টিরও বেশি বিষয়কে Ranking Factor হিসেবে ধরে থাকে।

যেমন, আমার এই কন্টেন্ট টি গুগল সম্পর্কিত। এখন, কেউ যদি, গুগল সম্পর্কে জানতে আগ্রহী হয়, তিনি নিশ্চয়ই “what is google” বা “Google কি“, এটি লিখেই সার্চ করবেন। এই আর্টিকেলে যদি Google ’ শব্দটি, অন্য লিঙ্ক গুলোর তুলনায় বেশি থাকে তবে এটি rank করবে । আবার, আমার আর্টিকেল থেকে যদি অনেক মানুষ, তার প্রয়োজনীয় সকল তথ্য পেয়ে যান, তাহলে পুরো লেখাটিই তারা পড়বেন। সেক্ষেত্রে, এই লিঙ্কের View Time বেশি হবে। তাহলে এই লিঙ্কটি Ranking এ প্রথম পেইজে থাকবে। কিন্তু, এই Ranking এর বিষয় টি আসলে আরো জটিল। কখনো কখনো Rank করার সকল শর্ত পূরণ হলেও, অনেক সাইট Rank করেনা। কারণ গুগলের আসল Raking Algorithm কখনো প্রকাশ করা হয় না। তাই, গুগলের আরো কি কি শর্ত রয়েছে, তা আমরা জানতে পারিনা।

Google কিভাবে কাজ করে তা না হয় জানলাম, এখন প্রশ্ন হল, এই এত এত তথ্য রাখা হয় কোথায়? এর উত্তর আসলে খুব সহজে। Google-এর Data Center-এ । পুরো বিশ্বজুড়ে গুগলের 32টির ও বেশি Data Center রয়েছে। শুধুমাত্র আমেরিকায় ই রয়েছে ১২ টি। এই প্রতিটি Data Center-এর আবার হাজার হাজার Server রয়েছে। একেকটি Data Center  470Exabyte তথ্য সংরক্ষণ করতে পারে।

শেষ কথা,

আশা করি এখন গুগল কাজ করে কিভাবে? তা আপনি ভালোভাবে বুঝতে পেরেছেন। সহজ ভাষায় বললে গুগল প্রথমে কোন নতুন জিনিসকে দেখার পর (Crawling) বিশেষজ্ঞ টিমের কাছে পাঠায়, বিশেষজ্ঞ টিম (Indexing) এটি পর্যবেক্ষণ করে কোন বিভাগের আওতাধীন তা ঠিক করে। এরপর নির্দিষ্ট বিভাগের কত নাম্বার পজিশনে (Ranking) আসবে তা ঠিক করে।

-ধন্যবাদ

Popular Post:

Give us your feedback!

Your email address will not be published. Required fields are marked *
0 Comments Write Comment