میزبانی وب سایت و هاستینگ بر روی سرور لینوکس با سی پنل

وب سایت یکی از روش های کسب و کار مدرن بحساب می آید. هر کسب و کاری باید امروزه بتوان آن را در اینترنت مشاهده کرد. بنابراین به منظور ایجاد یک وب سایت بر روی شبکه اینترنت باید یک سرور وب هاستینگ خوب را انتخاب کنید.

برای اینکه بر روی اینترنت بصورت خوب قابل مشاهده باشید باید یک سرور وب هاستینگ قابل اعتماد و خوب را انتخاب کرده باشید. سرور هاست یک سخت افزارمی باشد که باعث می شود وب سایت شما به صورت زنده بر روی اینترنت نشان داده شود و باعث محبوبیت و مشهور شدن وب سایت شما از طریق افزایش ترافیک به وب سایت شما میباشد. یکی از مشهورترین سرور وب هاستینگ در میان دیگر سرور ها سرور وب هاستینگ به اشتراک گذاشته شده میباشد. این سرور در میان کار افرینان کوچک بسیار محبوب میباشد. این سرور وب هاستینگ سروری میباشد که در آن بسیاری از وب سایت ها به صورت مشترک میزبانی شده اند.

در این نوع سرور واقع وب سایت های مختلفی در همان سرور میزبانی شده انده و به اینترنت متصل می شوند و همچنین از منابع موجود در آن سرور به صورت مشترک استفاده می کنند. در هاستینگ به اشتراک گذاشته شده شرکت ارائه دهنده خدمات وب هاستینگ مسئول تعمیر و نگهداری و بروز رسانی سرور میباشد. شرکت های ارائه دهنده وب هاستینگ به اشتراک گذاشته شده از سی پنل برای عملکرد کامل و خوب و قابل اعتماد از سرور وب هاستینگ استفاده می کنند.

سرور وب هاستینگ به اشتراک گذاشته شده می توان به دو روش مختلف انجام شود:

1 – بر اساس نام : این روش وب هاستینگ همچنین هاستینگ IP به اشتراک گذاشته شده نامیده می شود. این سرور وب هاستینگ نام هاست های متعدد را بر روی یک سرور میزبانی می کند.

2 – بر اساس IP : سرور وب هاستینگ مبتنی بر IP سروری است که هر اسم هاست را با یک آدرس IP در یک سرور میزبانی می کند.

مزایای مختلف و اشکالاتی از سرور لینوکس وب هاستینگ به اشتراک گذاشته شده با سی پنل وجود دارد. سرور های وب هاستینگ به اشتراک گذاشته شده وب سایت های مختلفی را بروی یک سرور پلتفورم جا می دهد که نتیجه آن به اشتراک گذاشتن منابع یک سرور بین همه وب سایت ها میباشد و احتمال آسیب وب سایت شما توسط دیگر وب سایت ها در همان سرور وجود دارد. مزایای این هاستینگ ارزانی قیمت آن میباشد و کسانی که می خواهند کسب و کار خود را شروع کنند و می خواهند وب سایت آنها در شبکه اینترنت نمایان باشد بسیار مناسب میباشد.

رعایت نکات امنیتی بیشتر در جوملا

امنیت جوملا برای کسانی از ان استفاده می‌کنند و به خصوص کسانی که یکبار سایت انها هک شده است بسیار مهم می‌باشد و نصب فقط کامپوننت‌های امنیتی از قبیل Defender، RS Firewall، X-Defender و یا غیره نمی‌تواند کافی باشد.

به همین منظور در این آموزش راه کارهایی جهت بهبود امنیت وب سایت جوملا شما ارائه می‌شود:

محافظت از طریق .htaccess

کلیه فرآیندهای جوملا براساس 2 فایل index.php و index2.php انجام می‌شود به همین منظور شما می‌توانید با استفاده از کدهای زیر از اجرای سایر فایل‌های PHP که ممکن است در میان فایل‌های شما آپلود شده باشند و در درون آنها backdoor وجود داشته باشد خودداری نمایید.

کد:

<Filesmatch “.(php)$”>
order deny,allow
deny from all
</Filesmatch>

<Filesmatch “^index.php”>
order allow,deny
allow from all
</Filesmatch>

<Filesmatch “^index2.php”>
order deny,allow
allow from all
</Filesmatch>

البته ممکن است یک هکر دانا یک backdoor را با نام index.php در یکی از پوشه‌های جوملا شما آپلود نماید به همین منظور از کد زیر در همه زیر پوشه‌ها استفاده نمایید:

کد:

<Files ~ “.(php)$”>
Deny from all
</Files>

در پوشه مدیریت نیاز است شما از کد زیر استفاده نمایید:

کد:

<Files ~ “.(php)$”>
Deny from all
</Files>

 

محافظت از طریق FTP

می‌دانید که مشخصات FTP هاست شما در درون فایل configuration.php برای استفاده جوملا وجود دارد و در صورت دست یافتن هکر به این اطلاعات ، هکر می‌تواند به سادگی سایت شما را هک نماید.
به همین منظور شما می توانید دسترسی به FTP را به IP خود سرور و مثلا IP خودتان محدود نمایید.

مثال زیر برای proftpd می‌باشد و این امر برای سایر سرویس دهنده‌های FTP کمی متفاوت است.

در فایل /etc/proftpd.conf خط زیر را اضافه نمایید

کد:

<Limit LOGIN>
Order allow,deny
Allow from 11.22.33.44
Allow from 127.0.0.1
Deny from all
</Limit>

IP شماره 11.22.33.44 مثلا متعلقه به کامپیوتر شما است و IP شماره 127.0.0.1 متعلق به سرور است تا بتواند از FTP استفاده نماید

بلوک کردن IP‌ها

معمولا اکثر سایت‌ها نیازی به مراجعه کاربران از کشورهای هکرخیز مانند چین و روسیه ندارند به همین منظور می‌توانید با استفاده از سایت زیر ، بازه IP‌های کشور مورد نظر را یافته و مسدود نمایید:

کد:

countryipblocks.net/country-blocks/select-formats
/sbin/iptables -I INPUT -s 88.147.196.0/88.147.253.255 -j DROP

 

فایل‌ها و پوشه‌ها

اکنون زمان محافظت از فایل‌ها و پوشه‌ها است. مالک فایل‌ها و پوشه‌ها کاربر FTP و دسترسی پوشه‌ها 755 و دسترسی فایل‌ها 644 می‌باشد به همین منظور دستور زیر را اجرا نمایید:

کد:

Navigate to joomla root chown -R user:group ./ chmod -R 0644 ./ find . -type d -exec chmod 755 {} ;

با این کار مالک فایل‌های شما تغییر کرده و دیگر PHP قادر به نوشتن بر روی فایل‌ها نمی‌باشد.

البته فراموش نکنید که باید به صورت دستی دسترسی cache و backupsرا 777 نمایید.

جوملا خود را به روز نگه دارید

شما همواره باید جوملا خود را به روز نگه دارید و پس از انتشار هر نسخه جدید ، سریعا جوملا خود را به نسخه جدیدتر ارتقا دهید.

محافطت از پوشه administrator

یکی از راه‌های ساده جهت محافظت از جوملا گذاشتن رمزعبور بر روی پوشه Administrator است با این کار در صورتی که هکر ، نام کاربری و رمزعبور شما را هم داشته باشد قادر به تخریب زیادی در سایت شما نخواهد بود.

کاهش دسترسی کاربر admin

کاربر admin که مدیرکل جوملا می‌باشد همواره یکی از اهداف حمله هکرها می‌باشد. به همین منظور یک کاربر مدیر کل دیگر ایجاد نموده و سپس با آن وارد بخش مدیریت شده و دسترسی کاربر admin را به “کاربر ثبت شده” تغییر دهید.

نصب پلاگین jSecure Authentication

نصب این پلاگین باعث ایجاد امنیت بیشتر در مسیر ورودی به مدیریت جوملای شما می‌شود.

تغییر پیشوند جداول دیتابیس

از دیتابیس خود بکاپ بگیرید.

وارد مدیریت جوملا شوید.

در تنظیمات کلی وارد بخش دیتابیس شوید.

پیشوند جداول را به مثلا به rthf_ تغییر داده و سپس ذخیره نمایید.

وارد phpMyAdmin شوید.

وارد export شده و از دیتابیس خود خروجی ساده بگیرید.

کل خروجی ایجاد شده را کپی نمایید.

در phpMyAdmin کلیه جدول‌ها را حذف نمایید.

در notepad عبارت jos_ را مثلا با rthf_ جایگزین نمایید.

وارد تب SQL شده و متن را از notapad کپی و سپس بر روی دکمه Go کلیک نمایید.

چگونگی معرفی وب سایت به موتورهای جستجو

این مقاله شامل چهار راهکار آسان برای معرفی وب سایت به موتور جستجوی گوگل و افزایش رتبه صفحات خود در نتایج جستجو می باشد. با اینکار گوگل همواره سایت شما را لیست (Index) کرده و موجب جذب ترافیک هرچه بیشتر در وب سایتتان می گردد…

اگر وب سایتی که به تازگی طراحی و آپلود نمودید در نتایج جستجو در موتور جستجوی گوگل نمایش داده نمی شود، می توانید از چهار راهکار ارایه شده در این مقاله استفاده نمایید تا وب سایت خود را به گوگل معرفی کنید. با این کار روبات های گوگل (Google Spider) را قادر خواهید ساخت تا بتوانند در صفحات شما جستجو کرده و گوگل با توجه به اطلاعات به دست آمده وب سایت شما را در لیست های خود قرار دهد.

businesswebsite

نقشه سایت (Site Map)  خود را بسازید

ساده ترین راه برای ساخت این ابزار ایجاد یک حساب کاربری Web master در گوگل می باشد. اگر مالک وب سایتی هستید می توانید به سادگی به آدرس www.google.com/webmasters مراجعه کرده و از این سرویس رایگان استفاده کنید. بعد از ثبت نام در این سرویس و ورود به حساب کاربری خود می توانید با کمک راهنمایی های درج شده به راحتی نقشه سایت خود را بسازید و سپس آن را به گوگل اعلام نمایید. نقشه سایت یک فایل XML است که دارای لینک هایی به قسمت های متعدد وب سایت در صفحات مختلف می باشد.

web-site-structure-map

محیط کاربری Webmaster به مالکین وب سایت کمک می کند تا نحوه کار وب سایت خود را بهتر درک کرده و بتوانند خطاهای احتمالی پیمایشگرهای وب (Crawler) را شناسایی و رفع کنند و ایده های مفیدی درباره چگونگی تعریف کلید واژه های مورد استفاده توسط کاربران را بدست آورید.

 

لینک دهنده ها (Backlinks)

 یکی از مشکلات بزرگی که اکثر سایت های تازه ساخته شده دچار آن هستند، ایزوله بودن وب سایت در فضای اینترنت می باشد. چنین سایت هایی هیچ گونه لینک خارجی ندارند و هیچ لینکی در وب سایت های دیگر به آن ها اشاره نمی کند. که این امر باعث می شودکه پیماشگرهای وب (Crawler) حتی از وجود چنین سایت هایی مطلع نشوند.

بهترین راهکار برای رفع این مشکل، ارسال نام وب سایت به دایرکتوری های محلی است. به عنوان مثال برای سایتی که در کشور نیوزیلند فعالیت می کند ، بهترین راه ارسال نام آن به دایرکتوریهای رایگان نظیر NZS.comمی باشد. با اینکار روبوت های پیمایشگر وب میتوانند وب سایت شما را در لیست های موجود ببینند و سپس به لیست نمودن صفحات آن بپردازند. با توجه به محل فعالیت وب سایت خود می توانید دایرکتوری های مناسب و رایگان را در اینترنت جستجو و پیدا کنید.

همچنین قابل ذکر است که گوگل برای سایت هایی که توسط پیمایشگرها یافت شوند، ارزش بیشتری قائل می شود. شما نیز می توانید آدرس سایت خود را از طریق آدرس زیر به طور مستقیم برای گوگل ارسال نمایید.

www.google.com/addurl

اطلاعات و محتوای با کیفیت

 تهیه محتوای با کیفیت بالا کار ساده ای نیست اما لازم است بدانید تا در صورتیکه وب سایت شما دارای اطلاعات منحصر بفرد و ارزشمندی باشد که توضیحات مفیدی را در مورد محصولات یا خدمات شما به کاربران ارایه دهد، موتورهای جستجو نیز از آن مطلع شده و با افزایش رتبه صفحه شما در نتایج جستجو، تشویقتان می کنند.

اطلاعات مفید و با کیفیت در وب سایت می تواند بازدیدکنندگان معمولی را تبدیل به مشتریانی سود آور برای شما تبدیل کند. آن ها همچنین می توانند باعث جذب لینک های خارجی به وب سایت شما شوند، به صورتی که سایت های هم رشته دیگر، آدرس شما را به عنوان منبعی معتبر معرفی نمایند. هر لینک خارجی که به وب سایت شما اشاره کند به عنوان یک امتیاز مثبت توسط گوگل به شمار خواهد رفت.

هیچ گاه از درج لینک سایت های معتبر در وب سایت خود دریغ نکنید. بسیاری به غلط تصور می کنند که به این صورت باعث تبلیغ رایگان سایرین می شوند، اما باید در نظر داشته باشید تا با این کار در دراز مدت می توانید یک رابطه همسایگی مناسب با سایت های پر بازدید به وجود آورید.

 

شروع به نوشتن بلاگ کنید !

وردپرس

صرف نظر از ابعاد کسب و کار و رشته صنعتی که درآن فعالیت می کنید و ابعاد جغرافیایی که تجارت شما را محدود می کنند، با ایجاد یک بلاگ می توانید آثار مفیدی را در کسب و کار خود ایجاد نمایید. اگر بتوانید برتری محصولات خود را در قالب بلاگ به کاربران معرفی کنید، حتما برنده خواهید بود.

گوگل به منابع اطلاعاتی علاقه زیادی دارد که بلاگ نیز یکی از آن هاست. شما می توانید همواره از آخرین تحولات و مراحل تولید در رشته خود سخن بگویید که اینکار بعد از مدتی موجب تبدیل شدن شما به یک مرجع معتبر در گروه کاریتان و جذب پیروان با وفایی می گردد که همواره به اطلاعات شما اعتماد دارند و خود نیز به اشتراک اطلاعات مفید در سایت کمک می کنند.

WordPress یکی از ابزارهای رایگان فوق العاده مفید است که هم اکنون به عنوان بهترین نرم افزار بلاگینگ در دنیای سایبری شناخته می شود.با استفاده از این نرم افزار، هر بار که مقاله جدیدی را در بلاگ خود اضافه می کنید، درخواستی (Ping) به موتورهای جستجو ارسال می شود و با اینکار پیمایشگرها مجددا به سایت شما آمده و اطلاعات خود را بروز می نمایند.اگر در مورد کسب و کار خود جدی هستید و پیشرفت هدف نهایی شماست، سرمایه گذاری بر روی نام دامین و میزبانی برای راه اندازی یک سیستم بلاگینگ قوی با وردپرس می تواند نتایج ارزشمندی را به همراه داشته باشد و اعتبار شما را نزد کاربران افزایش دهد.

 منبع :

 http://www.nzs.com/website-resources/search-engine-optimisation/introducing-your-website-to-google/

آیا زمان لود شدن یک صفحه تاثیری در SEO دارد؟

آیا مقدار زمانی که طول می کشد تا یک صفحه وب در جستجوگر لود شود تاثیری در رتبه آن صفحه در موتورهای  جستجو دارد؟ اینطور است؟

اگر اینگونه باشد، سایتهایی که از TEXT بیشتری در صفحات خود استفاده می کنند جایگاه بالاتری نسبت به سایتهایی که در آنها از عکس و برنامه های کاربردی استفاده می شود، دارند؟! و یا موتورهای جستجو برای توصیف نوع های مختلف سایت ها و مدت زمانی که جستجوگر برای پردازش آن صفحه بر اساس داده های کاربرصرف می کند تا آن را نمایش دهد، مکانیزم هایی دارند؟

seo-300x140

یک تحقیق کاربردی در Yahoo روشهایی را بررسی کرده است که نشان می دهد موتورهای جستجو مدت زمان بارگزاری صفحات را بر اساس انوع مختلف  صفحات در نظر می گیرند و صفحات پر سرعت (صفحاتی که با سرعت بالا لود می شوند) در مواردی که شامل رتبه بندی، طبقه بندی و لیست شدن آنها در موتورهای جستجو می شود تاثیر دارند.

Latency

section_bnr-Applications-LowLatency

Latency یک مفهوم کلی می باشد که به صورت ساده به مقدار زمانی که از آغاز یک رویداد تا مشاهده تاثیر آن دیده شود گفته می شود. این کلمه اغلب در تحقیق Yahoo  دیده می شود. این کلمه ایست که ارزش یادگیری بیشتری دارد، مخصوصا زمانی که در ارتباط با وب سایتها و چگونگی استفاده کاربران و موتورهای جستجو در آن مطرح باشد.

در یک موتور جستجو محدوده اطلاعات فراوانی برای لیست کردن صفحات در وب نظر گرفته می شود و با توجه به این اطلاعات، رتبه بندی و طبقه بندی صفحات انجام می شود. سیگنالهایی که شامل محتوای صفحات نمایش داده شده، لینک ها و متن های موجود درآن و اطلاعاتی در مورد اینکه کاربران چگونه از این صفحات استفاده می کنند می شود. همچنین سرعت پردازش و لود شدن یک صفحه در جستجوگر واینکه یک بازدید کننده چه مقدار برای دیدن صفحه ای که سرعت لود شدن آن پایین است وقت صرف می کند در موتورهای جستجو مورد پردازش قرار می گیرد.

تحقیق کاربردی Yahoo:

Web Document User Experience Characterization Methods and Systems
Invented by Konstantinos Tsioutsiouliklis and Marcin M. Kadluczka
US Patent Application 20090187592

خلاصه ای از این تحقیق:

روش ها و سیستم هایی ارائه شده است که توصیف کننده تجربه یک کاربر هنگام بازدید از یک وب سایت است.

سیگنالهای اطلاعاتی و موتورهای جستجو

Facebook-Profile-Illustration

هنگامی که یک موتور جستجو صفحات را در نتایج جستجو رتبه بندی می کند به دنبال علامت هایی می گردد که نشان دهنده میزان ارتباط آن صفحات به عنوان جستجو است. برای مثال دفعات استفاده از کلمات موجود در عنوان جستجو، در صفحات نمایش داده شده.

یک موتور جستجو همچنین ممکن است به دنبال نشانگرهای کیفیت صفحاتی که در نتیجه جستجو لیست می کند نیز بگردد. برای مثال نشانگری چون رتبه صفحه، یک نشانگر کیفیتی محسوب می شود تا ارتباطی، زیرا به دنبال اعداد و اهمیت پیوندهایی که به یک صفحه اشاره دارند می گردد. نشانگرهای کیفیتی نیز وجود دارند که یک موتور جستجو ممکن است به کار ببرد. مانند: حجم متن در یک صفحه، میزان خوانایی یک متن، وجود پیوندهای شکسته در یک صفحه و چندین فاکتور دیگر . . .

یک موتور جستجو سعی می کند صفحاتی را ارائه دهد که از نظر ارتباط با موضوع جستجو و کیفیت در سطح بالایی باشد.

یکی دیگر از نشانگرها یا فاکتورهایی که یک موتور جستجو ممکن است مورد استفاده قرار دهد نحوه ارتباط متقابل کاربران با صفحاتیست که در شبکه می یابد. این نشانگرها می توانند شامل صفحاتی که کاربران بیشتر در نتیجه حاصل از جستجو اتخاب می کنند باشد یا زمانی که فرد در یک صفحه پیش از بازگشتن به نتایج حاصل از جستجو وقت صرف می کند، میزان پیشروی افراد در خواندن متن، اینکه آن صفحه را نشانه گذاری و ذخیره می کنند یا نه و فاکتورهای دیگر . . .

این نشانگرها بر اینکه صفحات تا چه میزان توقعات کاربران را براورده می کنند تکیه دارند. با نگاه کردن به عملکرد صفحات و تعامل واقعی کاربران با این صفحات به ما نشان می دهد که با توجه به حجم بالای صفحات اینترنتی و نرم افزارها و سخت افزارهای مختلف بهتر است بدانیم چه صفحاتی منجر به برآورده شدن توقعات کاربر می شود. در برخی موارد بهتر است بدانیم چه صفحاتی اگر انتخاب شوند قادر به اجرای امور کاربر نیستند. چنین عملکردهایی ممکن است رای مثال تحت تاثیر سرور، شبکه، مشترک، فایل، سخت ازار، نرم افزار و firmware مربوط به آن باشد.

خصوصیات تجربی کاربران

whatisux

ثبت صفحات توسط کاربر تا حد زیادی به سرعت بارگزاری آنها بستگی دارد و این مورد حتی تاثیر بیشتری نسبت به رتبه آن صفحه در نتایج جستجو دارد.

این موضوع می تواند به ما اطلاعاتی در مورد پیچیدگی سیستم مورد استفاده در یک موتور جستجو، پرتالهای کاری، سایتهای جستجوی خرید،سایتهای جستجوی خبری یا RSS و انواع دیگر صفحات و اینکه چگونه آنها را تحلیل کند در 3 شاخه مختلف ارائه کند:

دسترسی (Access)

access

میزان سرعت دسترسی به مدارک هنگامی که درخواست بارگزاری صفحه یا مدارکی را می کنیم. این اندازه گیری می تواند شامل توجه به عملکرد سرور و یا پوشه باشد. همچنین می تواند شامل سرعت بارگزاری صفحه برای کاربران مختلف که دارای سرعت های اینترنتی متفاوت هستند باشد.

یک موتور جستجوی قوی برنامه هایی دارد که می تواند سرعت های مختلف اینترنتی را بازسازی نموده و عملکرد یک صفحه را اندازه گیری نماید.

بارگذاری (Render)

nginx Benchmark_CanvasRendering_Web

میزان سرعت بارگذاری (لود شدن) مناسب یک صفحه در یک نمایشگر و مدت زمانی که طول می کشد تا صفحه به صورت کامل و یا تا حدودی لود شود، نشانه آن است که گرچه در برخی از صفحات حجم اطلاعاتی بسیاری وجود دارد اما بخش مقدماتی صفحه سریع تر بارگزاری می شود، در نتیجه بازدید کننده نیازمند صرف زمان زیادی برای بازدید و خواندن صفحه نمی باشد.

همچنین فاکتورهای دیگری نظیر تفاوت در پیچیدگی، اندازه، تعداد پوشه ها، مکانیزم های واسط کاربری، بخش های درونی (مانند: آگهی ها، محتوای صوتی، محتوای تصویری، ویژگیهای امنیتی و . . . ) که در درک توانایی بارگزاری یک صفحه و تجربه کاربر از آن دخیل هستند.

تجربه کاربر ( User Experience)

چگونگی استفاده افراد از صفحات اینترنتی و چگونگی برخورد آنها با دسترسی های مختلف و بارگزاری آنها در سایت های مختلف.

افراد میزان تحملهای مختلفی هنگام بارگزاری صفحات اینترنتی از خود نشان می دهند و گاهی کاربران ترجیح می دهند زمان بیشتری را برای بارگزاری صفحه ای خاص صرف کنند. برای مثال گاهی آنان ترجیح می دهند زمان بیشتری را صرف انتظار برای بارگزاری صفحه اطلاعات بانکی خود کنند تا اینکه این زمان صرف سایتهای معمول تر شود.

فاکتورهای دیگر مرتبط با عمکرد کاربران می توانند نشان گر چگونگی عکس العمل بازدید کننده نسبت به:

صفحاتی که قادر به دانلود و یا بارگزاری در مدت زمان معقولی نشوند.

صفحاتی که به صورت خودکار قطعات تصویری و یا صوتی پخش میکنند.

صفحاتی که شامل تبلیغات خود باز شونده (pop-up) می شوند.

صفحاتی که بنا به دلایل مختلفی تاخیر بیشتری نسبت به صفحات دیگر دارند. صفحاتی که ممکن است شامل Javascript، Flash، لینکها خارجی و تو در تو و پلاگین ها باشد.

چگونه مدت زمان تاخیر و تجربه کاربران در موتورهای جستجو مورد استفاده قرار می گیرد؟

متخصصان در پشت پرده برنامه های کاربردی،حداقل سه مورد را برای اندازه گیری بازده بر اساس دسترسی، بارگزاری و تجربه کاربران در موتورهای جستجو در نظر می گیرند : رتبه بندی (Ranking)، دسته بندی (classification) و Crawling.

رتبه بندی (Ranking): اطلاعات حاصل از تجربه کاربر می توانند به منظور رسیدن به یک تجربه بهتر در جهت فیلتر کردن، ارتقاع، و یا تنزل یک صفحه استفاده می شوند.

دسته بندی (classification): اطلاعات حاصل از تجربه کاربر ممکن است به هر نحوی در طبقه بندی صفحات مورد استفاده قرار بگیرد. ظاهر یک صفحه می تواند بیانگر این باشد که سایت موردنظر شامل برخی محتویات مربوط به نوع خاصی از سایت ها است. برای مثال: وب سایت های مرتبط با امور مالی و سرمایه گذاری اغلب داده های مرتبط با بازارهای سهام  را نشان می دهند، یا وب سایت های خبری اغلب از جریان اطلاعات خبری استفاده می کنند و برخی دیگر از سایت ها اشکال یا جداولی را به کار می برند که که می تواند در رتبه بندی آنها در میان صفحات وب مورد استفاده قرار بگیرد.

Crawling: هنگامی که یک موتور جستجو برای بررسی برخی از URLها که تا کنون آنها را بازدید نکرده و یا برای بررسی مجدد محتوای URLهای قبلی اقدام می کند موارد مختلفی را برای اینکه تشخیص دهد کدام یک را اول بررسی کند مورد توجه قرار می دهد. اطلاعات مربوط به تجربه کاربر می تواند برای مواردی که ممکن است قبلا در نظر گرفته نمی شده است در تصمیم گیری موتور جستجو هنگام بازدید یک صفحه مورد استفاده قرار بگیرد.

برای مثال اطلاعاتی مرتبط با اینکه یک کاربر صفحه را رها می کند و یا منتظر نمایش اطلاعات آن می شود تا ببیند محتوای آن مفید است. و یا در برخی موارد بطور خاص انتظار یک کاربر برای دانلود یک فایل موجود در صفحه فاکتور مهمی است و در یک اجرای معین این اطلاعات می تواند در Crawler و پردازش گرهای دیگر شبیه به آن مشخص کند که آیا صفحه مذکور جهت ایجاد پارامترهای کاربردی مورد ارزیابی قرار گرفته است یا خیر.

نتیجه گیری

یک موتور جستجو ممکن است زمان اتصال و نمایش محتوای یک صفحه را شبیه سازی یا ارزیابی کند. روش و مقدار زمانی که یک صفحه در جستجوگر پردازش می شود و عکس العمل کاربران به این موارد و همچنین اطلاعات و محتوای آنها که شامل جاوا اسکریپت، فایلهای فلش و . . . می شود، در رتبه بندی، دسته بندی و اینکه یک صفحه چگونه Index شود تاثیر گذار است.

دقیقا معلوم نیست که آیا همه موتورهای جستجو در حال حاضر از پردازشهای شرح داده شده در این تحقیق استفاده می کنند یا نه! اما این تحقیق ایده هایی را در مورد روشها و نحوه جمع آوری اطلاعات توسط موتورهای جستجو پیش پای می گذارد..