টেকনিক্যাল এসইও গাইডলাইন : যে ত্রুটিগুলো থাকলে গুগল আপনার সাইটকে ক্রল করবে না

সার্চ ইঞ্জিন অপটিমাইজেশান এবং অর্গানিক ট্রাফিকের পরিমাণ বাড়ানোর ক্ষেত্রে, আপনার ওয়েবসাইটের টেকনিক্যাল বিষয়গুলো ঠিক রাখা অত্যান্ত জরুরী। এই কারিগরি উপাদানগুলোর মাঝে কোন সমস্যা থাকলে সার্চ ইঞ্জিন অপটিমাইজেশানের অন্য সব প্রচেষ্টাগুলো বিফলে যেতে পারে। আপনার ওয়েবাসাইটের প্রযুক্তিতে গন্ডগোল থাকলে আপনার কন্টেন্টকে ক্রল করবে না সার্চ ইঞ্জিন। সুতরাং, সবার প্রথমে নিশ্চিত করুন, আপনার ওয়েবসাইটের টেকনিক্যাল বিষয়গুলো ঠিক আছে কি না।

যে ত্রুটিগুলো থাকলে গুগল আপনার সাইটকে ক্রল করবে না

ওয়েবসাইটগুলোর ব্যবস্থাপনা করে একটি কন্টেন্ট ম্যানেজমেন্ট সিস্টেম বা সিএমএস (CMS)। ওয়েবসাইটের সার্ভার এই ম্যানেজমেন্ট সিস্টেমটিকে ধারণ করে। সার্চ ইঞ্জিনগুলো আপনার ওয়েবসাইটে পৌঁছে কিভাবে কন্টেন্টকে ক্রল করবে তার ওপর ম্যানেজমেন্ট সিস্টেম এবং ওয়েবসাইট সার্ভারের প্রভাব গুরুত্বপূর্ণ। অধিকাংশ সার্চ ইঞ্জিন ক্রলার আপনার সাইটে এসে আপনাকে যাচাই করার জন্য এই বিষয়গুলোকেই প্রধান হিসেবে গণ্য করে।

ক্রলারগুলো আপনার সাইট ঘুরে কম বেশী এগারটি ইস্যু নিয়ে একটি রিপোর্ট দাঁড় করায়। ক্রলারগুলো যাতে সঠিক ও কাঙ্ক্ষিতরূপে আপনার সাইটকে ক্রল করতে পারে সেজন্য এই এগারটি জিনিস ঠিক রাখা জরুরী। এই তালিকায় ঘাটতি নেই, এমন দাবী করছি না। তারপরও গুরুত্বপূ্র্ণ সবকটি বিষয়কেই বর্ণণা করার চেষ্টা করা হল-

১। ইউআরএল’র গঠন

সার্চ ইঞ্জিনদের কাছে ইউআরএল একটি গুরুত্বপূর্ণ বিষয়। আপনার জন্য আপনার জাতীয় ভোটার আইডি কার্ডের নাম্বারটি যেমন, একটি পূর্ণাঙ্গ ইউআরএলও তার পেজটির জন্য তেমনই। অর্থাৎ, এটি পেজের একটি অদ্বীতিয় পরিচয়। তাছাড়াও, পেজটি কি বিষয়ে সেটি বোঝার জন্য সার্চ ইঞ্জিনগুলো ইউআরএলের দিকেই তাকায়। যে কারণে, আগেও যেমন কোন এক আলোচনায় বলা হয়েছে, ইউআরএল এবং তাদের ফোল্ডার স্ট্রাকচারগুলোতে কিওয়ার্ড অন্তর্ভুক্ত থাকা বেশ জরুরী।

বিভিন্ন টার্মগুলোকে পৃথক করার জন্য মাঝখানে “হাইফেন” ব্যবহার করা সবচেয়ে ভাল। হাইফেনগুলো সার্চ ইঞ্জিনকে জানায় যে এই শব্দগুলোকে পৃথক টার্ম হিসেবে গণ্য করতে হবে। একসাথে মিলিয়ে সার্চ রেজাল্টে ফ্রেস বা শব্দগুচ্ছ হিসেবে তাদেরকে র্যাঙ্ক করা যাবে না।

‌আরেকটি বিষয় হচ্ছে, কিওয়ার্ডটি ইউআরএল’র রুট ফোল্ডারের যত কাছে থাকবে তার গুরুত্ব ততই বৃদ্ধি পাবে। রুট ফোল্ডার বলতে যে ফোল্ডারটি ডট কমের সবচেয়ে নিকটে থাকে। আপনি যে সার্চ টার্মের জন্য র্যাঙ্ক করতে চাচ্ছেন, সেটি যতই প্রচলিত এবং প্রতিযোগিতা প্রবণ হবে, রুট ফেল্ডারেরও ততই বেশী কাছে রাখতে হবে সার্চ টার্মটিকে।

সেই সাথে আরেকটি বিষয় উল্লেখ করতে হয়। পুরো ওয়েবসাইটে একটি পেজের জন্য একাধিক ইউআরএল ব্যবহার করবেন না। অনেক সাইট আছে যারা ইউজারদের গতিবিধি বোঝার জন্য বা সাইটের কোথায় ইউজার ক্লিক করলেন সেই ভিত্তিতে ডায়নামিক কন্টেন্ট দেখানোর খাতিরে একই পেজের একাধিক ইউআরএল ব্যবহার করেন।

এটি এসইও’র ক্ষেত্রে এবং সাইটের র্যাঙ্কিঙে একটি বাজে প্রভাব ফেলবে। গুগলের এলগরিদম এমনও ভাবতে পারে যে আপনি কন্টেন্ট ডুপ্লিকেট করছেন বা কন্টেন্টের পুনরাবৃত্তি করছেন। এরকম ক্ষেত্রে আপনাকে দুই নম্বরী সাইট হিসেবে সাব্যস্ত করবে গুগল।

২। রিডিরেক্ট (Redirect)

একটি পেজ যদি নতুন কোন ইউআরএল-এ সরিয়ে নেয়া হয়, সেক্ষেত্রে ‘রিডিরেক্ট’ ব্যবহার করা হয়। রিডিরেক্টের বিষয়টি ক্ষণস্থায়ী (টেম্পোরারি) বা স্থায়ী (পার্মানেন্ট) দুটোই হতে পারে। তবে সার্চ ইঞ্জিনগুলো শুধুমাত্র পার্মানেন্ট রিডিরেক্টকেই গণ্য করে। অর্থাৎ, এসইও’র ক্ষেত্রে পার্মানেন্ট রিডিরেক্টই গুরুত্বপূর্ণ। এগুলোকে বলে 301 রিডিরেক্ট। অন্যদিকে ক্ষণস্থানী বা টেম্পোরারী রিডিরেক্টগুলো 302 রিডিরেক্ট। এ দুটোকেই ম্যানেজ করে ওয়েবসাইটের সার্ভার।

ওয়েবমাষ্টার হিসেবে আপনি সবসময়ই চাইবেন পার্মানেন্ট রিডিরেক্ট ব্যবহার করতে। কারণ ক্ষণস্থায়ী ভাবে কোন পেজকে অন্য ইউআরএল-এর সরিয়ে রাখা হয়েছে এমনটা সাধারণতঃ বিরল। আপনি যদি একটি টেম্পোরারি রিডিরেক্ট ব্যবহার করেন, তো সেটিকে চিহ্নিত করে রাখুন। কতদিন ধরে এবং কি জন্য টেম্পোরারি রিডিরেক্টটি ব্যবহার করছেন সেটি মূল্যায়ন করুন। তেমন কোন যদি কারণ না থাকে তাহলে পার্মানেন্টে পাল্টে নিন।

যেকোন এসইও বিশেষজ্ঞই আপনাকে বা আপনার আইটি টীমকে নির্দেশ দিবেন থ্রী জিরো ওয়ান পার্মানেন্ট রিডিরেক্ট ব্যবহার করার জন্য, যেন পেজটির নতুন ঠিকানা এসইও’র আওতাভুক্ত হতে পারে।

৩। ব্রোকেন পেজ বা 404 Error

একটি 404 error পেজের অর্থ এই ওয়েবপেজটিতে এখন আর প্রবেশ করা যায় না। বা এই পেজটি ঐ ঠিকানায় এখন আর নেই। এটি সাধারণতঃ একটি ব্রোকেন লিংকের ফলে হয়ে থাকে। বা কোন লিংক যদি কোন ওয়েবপেজের ভুল ইউআরএল ব্যবহার করে তখনও এমন হয়। একটি 404 error ইউজারের অনলাইন অভিজ্ঞতায় একটি ব্যাঘাতের সৃষ্টি করে। ইউজার যে পেজে যুক্ত হতে চান, সেটিতে যুক্ত হতে পারেন না। একারণে যেসব ওয়েবসাইটে 404 error তৈরি করে, সেগুলোর ট্রাফিক এবং এসইও র্যাঙ্কিঙ স্বাভাবিক ভাবেই কমে যেতে থাকে।

৪। ওয়েবপেজ এবং ওয়েবসাইট লোড হতে কেমন সময় লাগে (Loading Speed)

কতদ্রুত একটি ওয়েবপেজ লোড হয়, অর্থাৎ যাকে বলে “পেজ স্পীড” – এই বিষয়টি সার্চ ইঞ্জিন র্যাঙ্কিঙের ক্ষেত্রে একটি প্রধানতম বিষয় বর্তমান কালে। গুগল যেভাবে নিজেকে নকশা করেছে তাতে মোবাইল ডিভাইসে ইউজারের অভিজ্ঞতা সবচেয়ে গুরুত্বপূর্ণ। সুতরাং মোবাইলে যেসব পেজ দ্রুত লোড হয় সার্চ ইঞ্জিনের র্যাঙ্কিঙেও তারা অগ্রসর।

দ্রুত লোড হতে পারে এমন পেজগুলো ইউজারদের ইতিবাচক অভিজ্ঞতা প্রদান করে। ফলে আপনার কনভার্সান রেটও বাড়িয়ে দেয়। এবার্ডিন গ্রুপ এই নিয়ে একটি গবেষণা করেছিল। দেখা গেল- পেজ লোডিং টাইমে প্রতি এক সেকেন্ড দেরীতে কনভার্সানে সাত শতাংশের পতন ঘটে।

আপনার সাইট বা ওয়েবপেজ ধীরে লোড হলে গুগল আপনার সার্চ ইঞ্জিন র্যাঙ্কিঙ কমিয়ে দেবে। সাধারণতঃ আপনার সার্ভারের পারফরম্যান্স এবং আপনার ওয়েবপেজের এইচটিএমএল কোডের ঘনত্ব বা ডেনসিটি পেজ লোডিঙের গতি কমিয়ে দেয়ার ক্ষেত্রে ভূমিকা রাখে।

অ-জটিল, ক্লিন এবং সহজে প্রসেস করা যায় এমন কোড লিখুন। যদি সার্ভার দায়ী হয়ে থাকে তাহলে, আপনার ওয়েবসাইট হোস্টের সাথে আলাপ করে দেখুন কি সমস্যা। ফলাফল না পেলে, হোস্ট পাল্টে ফেলুন। এমন একটি সার্ভিস প্রোভাইডারকে নিন, যে আপনার অভীষ্ট অডিয়েন্স এবং আপনার লোকেশান দু’টোরই অধিক নিকটবর্তী।

৫। বিভিন্ন এসইও মেটা ট্যাগ (SEO Meta Tag)

বিভিন্ন এইচটিএমএল ট্যাগগুলোকে প্রবল গুরুত্ব সহকারে গ্রাহ্য করে সার্চ ইঞ্জিন। এই ট্যাগগুলো আপনার সাইটকে ব্যখ্যা করে। সার্চ রেজাল্টে এই পেজটিকে প্রদর্শন করার সময় তার বিবরণটি কি রকম দিতে হবে, আপনার পেজটি কি বিষয়ক – রান্নাবান্না, পণ্য বিক্রয়, এসইও বিষয়ক পরামর্শ – এই সমস্ত কিছুই বিভিন্ন মেটা ট্যাগগুলোর মাধ্যমে নির্ধারিত হয়।

প্রতিটি পেজেরই স্বতন্ত্র ট্যাগ থাকা দরকার। ডুপ্লিকেট কন্টেন্টের মত, ডুপ্লিকেট ট্যাগও সার্চ ইঞ্জিনদের কাছে একটি সমস্যা হিসেবে পরিচিত। দুটি পেজের হুবহু একই ট্যাগ ব্যবহার করলে র্যাঙ্কিঙে আপনি পিছিয়ে পড়বেন। খেয়াল রাখবেন, ট্যাগের ক্যারেকটারের সংখ্যা যেন নির্ধারিত সীমার ভেতর থাকে। মেটা ট্যাগের বিভিন্ন মানদন্ডগুলো ক্রমাগত পরিবর্তন হচ্ছে। এগুলোর বিষয়ে ওয়াকিবহাল থাকা জরুরী।

৬। এক্সএমএল সাইটম্যাপ এবং রোবট ডট টিএক্সটি ফাইল

এক্সএমএল সাইটম্যাপ এবং রোবটস ডট টিএক্সটি ফাইলগুলো আপনার ওয়েবপেজের পক্ষ থেকে সার্চ ইঞ্জিনের সাথে যোগাযোগ করতে পারে। আপনার পেজকে সঠিকভাবে ক্রলিং এবং ইনডেক্সিঙের নির্দেশ দেয় এই ফাইলগুলো। সুতরাং এগুলোর প্রতি মনযোগ দিতে হবে।

৭। ডুপ্লিকেট কন্টেন্ট বা একই কন্টেন্ট বারবার ব্যবহার

গুগলের একদম প্রাথমিক পর্যায়ের স্প্যাম নির্ণয়ের একটি পদ্ধতি ছিল ডুপ্লিকেট কন্টেন্ট শনাক্তকরণ। একদম শুরু থেকেই বিষয়টি গুগলের এলগরিদামের ভেতর জুড়ে দেয়া আছে। দুটো ওয়েবপেজের কন্টেন্টের যদি আশি শতাংশ বা তার বেশী হুবহু মিলে যায় তাহলে তাদেরকে ডুপ্লিকেট কন্টেন্ট বিবেচনা করা হয়।

যেসব সাইটে ডুপ্লিকেট কন্টেন্ট থাকে সেগুলোকে সাধারণতঃ দুই নম্বরী সাইট হিসেবে চিহ্নিত করে থাকে গুগল। সার্চ ইঞ্জিনে তাদের র্যাঙ্কিঙও থাকে নীচের দিকে। অনেক সময় কন্টেন্ট ম্যানেজমেন্ট সিস্টেমে কোন ভুলবশতঃ বা ইউআরএল’র গঠনের কারণে দুর্ঘটনা রূপে ডুপ্লিকেট কন্টেন্ট সৃষ্টি হতে পারে। সুতরাং, একটি ওয়েবপেজের একটির বেশী ইউআরএল নেই এই বিষয়টি নিশ্চিত করুন।

৮। পেজ লিংকিং

একটি ওয়েবসাইটের ভেতরে পেজ লিংকিং করাটা খুবই জরুরী। সার্চ ইঞ্জিনগুলো সাইটকে ক্রল করার সময় এই লিংকগুলোর অনুসরণ করবে। আরেকটি বিষয় লিংকগুলোর এংকার টেক্সট। এই টেক্সট থেকেও ক্রলারগুলো ধারণা নেয় পেজটির বিষয় সমন্ধে। এই বিষয়টিকে বলা হয় রেলিভেন্সি বা প্রাসঙ্গিকতা।

প্রতিটি পেজেরই ওয়েবসাইটের ভেতরে কোথাও একটি হলেও ইন্টারনাল লিংক থাকা উচিত যেটি ভিজিটরকে ঐ পেজ পর্যন্ত নিয়ে আসে। এবং পেজটিকে আপনি যে টার্মের জন্য র্যাঙ্ক করাতে চান সেই শব্দটি এংকার টেক্সটে থাকা উচিত। আরেকটি জিনিস মনে রাখবেন যে সাইটের মধ্য থেকে (বাইরে থেকে নয়) একটি পেজের প্রতি ইন্টারনাল লিংকের সংখ্যা ৩০০০ ছাড়িয়ে যাওয়ার দরকার নেই।

৯। এইচটিটিপিএস এনক্রিপাশান (HTTPS Encryption)

ইউজারদের সামনে একটি সুরক্ষিত ওয়েবসাইট হাজির করাকে সার্চ ইঞ্জিনগুলো খুব বেশী প্রাধান্য দিচ্ছে বর্তমানে। সিকিউরিটি বিষয়টিকে সার্চ ইঞ্জিনের র্যাঙ্কিঙ এলগরিদামের অংশ হিসেবে অন্তর্ভুক্ত করা হয়েছে। গুগল বলছে “এইচটিটিপিএস (https)” একটি এমন ইন্টারনেট যোগাযোগ প্রটোকল যেটি ইউজারের কম্পিউটার এবং সাইটের মাঝে ডেটা বা তথ্যের গুণগত মান এবং গোপনীয়তা রক্ষা করে।” (সূত্র: গুগল ডেভেলপারস)

এইচটিটিপিএস সমর্থন করে না এমন ওয়েবসাইটগুলো সার্চ ইঞ্জিন রেজাল্টে নিজেদের র্যাঙ্কিঙ কমতে দেখবেন, এমনটাই আশা করা যায়। যেসব সাইট এইচটিটিপিএস ব্যবহার করছে তারা এই সাইটগুলোকে সার্চ ইঞ্জিন র্যাঙ্কিঙে পেছনে ফেলে দেবে।

১০। পেজের লে-আউট এবং টেক্সটের ব্যবহার

সার্চ ইঞ্জিনের শীর্ষে স্থান করে নেওয়া পেজগুলোতে কন্টেন্ট সাধারণতঃ বেশ দীর্ঘ হয়। যেকারণে কোন একটি বিষয় নিয়ে আপনার পেজে প্রচুর পরিমাণে টেক্সট থাকাটা একটি গুরুত্বপূর্ণ বিষয়। সাধারণতঃ দুই হাজার বা তার বেশী শব্দের সমৃদ্ধ কন্টেন্টকে কোন একটি সার্চ টার্মের জন্য উপযুক্ত ও পর্যাপ্ত পরিমাণ তথ্যপ্রদায়ী কন্টেন্ট হিসেবে বিবেচনা করে গুগল।

সুতরাং নিশ্চিত করুন, নির্দিষ্ট বিষয়বস্তুর সাপেক্ষে আপনার পেজে টেক্সটের যেন কোন কমতি না হয়। বিশেষ করে “ফোল্ড অফ দি পেজ” এর ওপর, অর্থাৎ লোডিং এর পর স্ক্রলিং ব্যাতীতই যে অংশটি প্রদর্শিত হয়, সেখানে যেন পর্যাপ্ত টেক্সটের অভাব কোন ভাবেই না থাকে।

ইমেজের ভেতরে টেক্সট এই ক্ষেত্রটিতে হিসেব করা হয় না। ইমেজ বা ছবিগুলো বুঝতে সার্চ ইঞ্জিনের এমনিতেই অনেক সমস্যা হয়ে থাকে। তারা সাধারণতঃ শুধুমাত্র পেজ স্ক্যান করে এবং বেসিক এইচটিএমএল টেক্সটের মর্মার্থ উদ্ধার করে।

১১। হ্রেফল্যাং ট্যাগ (hreflang tag)

সাধারণতঃ বড় ব্রান্ডগুলোর ক্ষেত্রে এই বিষয়টি প্রযোজ্য। এরকম প্রতিষ্ঠানগুলোর বিভিন্ন দেশ ও ভাষা সাপেক্ষে তাদের ওয়েবসাইটের ভিন্ন ভিন্ন সংস্করণ রাখতে হয়। একটি আদর্শ ক্ষেত্রে, প্রতিটি দেশেরই দেশভেদে ভিন্ন ভিন্ন সিটি-এলডি থাকবে। যেমন, মার্কিন যুক্তরাষ্ট্রে আমাজন ডট কম। আবার কানাডায় আমাজন ডট সিএ। কোন দেশে কোন কন্টেন্টটিকে র্যাঙ্ক করতে হবে সেটি সার্চ ইঞ্জিনকে জানান দেয়ার এটিই প্রচলিত পদ্ধতি।

সম্ভব না হলে, অন্য উপায়টি হচ্ছে একটি সাব-ডিরেক্টোরী ব্যবহার করা। আপনার ইউআরএল স্টাইল ঠিক করে ফেলার পর প্রতি পেজে হ্রেফল্যাঙ ট্যাগ (rel=”alternate” hreflang=”x”) ব্যবহার করুন। এই ট্যাগগুলো সার্চ ইঞ্জিনকে জানিয়ে দেবে যে, ভিজিটরদের লোকেশানের ভিত্তিতে সাইটের কোন পেজগুলো কাকে দেখাতে হবে। তাছাড়া, আপনি যদি একই দেশে দু’টো ভাষা পরিচালনা করে থাকেন (যেমন একটি বাংলাদেশী সাইট যেটি বাংলা এবং ইংলিশ দুই ভাষাতেই কন্টেন্ট তৈরী করে), সেক্ষেত্রে এই হ্রেফল্যাঙ ট্যাগগুলো ব্যবহার করা আরও বেশী গুরুত্বপূর্ণ।

এই আলোচনা এই পর্যন্তই। এই কারিগরি বিষয়গুলোর প্রতি মনযোগী না হলে আপনার সার্চ ইঞ্জিন অপটিমাইজেশানের সমস্ত প্রচেষ্টাই ব্যর্থ হতে পারে। সুতরাং এই বিষয়গুলোর প্রতি সতর্ক দৃষ্টি রাখুন।

প্রয়োজন মনে হলে পড়ে নিতে পারেন –

Leave a Comment