• 0 رای - 0 میانگین
  • 1
  • 2
  • 3
  • 4
  • 5
نتایج جستجوی گوگل از دیتابیس؟
#1
سلام
آقا من یه سوال دارم:

مگه اینجا تاپیک ها تو دیتا بیس ذخیره نمیشن؟

پس چرا وقتی گوگل سرچ میزنیم مثلاً یه دفعه یه تاپیک از ایران پی.اچ.پی رو پیدا میکنه؟

یا مثلاً چرا پروفایل وحید رو نشون میده؟

پروفایل Back door رو هم نشون میده Big Grin

اون خزنده گوگل اینا رو چه جوری میخونه؟ آیا مثلاً در لحظه مراجعه خزنده اونا باز بودن؟
هر که با مرغ هوا دوست شود - خوابش آرامترین خواب جهان خواهد بود.
  پاسخ
تشکر شده توسط :
#2
گوگل یه سیاستی داره که شما به هرچیزی یا هر آدرسی که علاقه ای رو در اون موضع داشته باشی به اون ارزش بیشتری در نتایج جستجو داره !
  پاسخ
تشکر شده توسط : Reza hamid_80386
#3
بعلاوه فکر کنم هر لینکی که ببینه باز می کنه
که الان پروفایل ما سه نفر توی این صفحه لینک شده - این صفحه هم در صفحه اول و...
وبلاگ: Yousha.Blog.ir


 کد کمتر => خطای کمتر => قابل فهمتر => خوانایی بالاتر => نگهداری بهتر

  پاسخ
تشکر شده توسط : Reza hamid_80386
#4
خب آخه این لینکا رو از کجاش در میاره؟
مگه این لینکا از دیتابیس fetch نمیشن؟ گوگل که پسورد دیتابیس ما رو نداره که...
هر که با مرغ هوا دوست شود - خوابش آرامترین خواب جهان خواهد بود.
  پاسخ
تشکر شده توسط : Reza
#5
گمون نکنم امکانش باشه که یوزر ایجنتی بتونه لحظه آنلاین بودن یک یوزر ایجنت دیگه در یک صفحه خاص بدون انجام هیچگونه عملیاتی روی صفحه مورد نظر رو تشخیص بده. پس مشخص شد که "در لحظه" هیچ معنی برای روبات (یه نوع یوزر ایجنت محسوب میشه) نداره.
روبات گوگل اصلاً دسترسی به سرور ما نداره. چطور این همه داده جور واجور جمع آوری میکنه خیلی سادست، دست کم یه بار اون لینک هرجا در معرض دید قرار گرفته (حتی اگر بعد خزیده شدن هم اون لینک حذف بشه جزء سوابق روبات محسوب میشه).
خیلی ساده بگم، روبات ها لینک ها رو میگیرن و میرن. درست مثل طنابی میمونه واسشون که اونا رو به صفحه های تکراری (قبلاً خزیده شده) و غیر تکراری راهبری میکنه.
غایب
  پاسخ
تشکر شده توسط : Reza hamid_80386 masoudmanson
#6
حالا این یه چیزی!
اون الکسا از کجا اطلاعات میاره من حیرانم .
وبلاگ rezaonline.net/blog
سفارش برنامه نویسی reza.biz
Php , mysql , postgresql , redis , Yii and ... Cool
  پاسخ
تشکر شده توسط : hamid_80386
#7
نگرفتم چی شد علیرضا...
ببین میگی روبات در لحظه نمیتونه لینک رو قاپ بزنه...
خب آخه مثلاً تو این سایت هر چی لینک هست در لحظه ایجاد میشه میشه دیگه! بعدم اینکه این لینک ها تو سرور که نیستن، یه سری داده از دیتابیس میگیریم، میریزیم تو یه قالب میفرستیم به Client Side ، در واقع فقط قالب خالی تو سرور هست، نمیتونم با موضوع ارتباط برقرار کنم؟
نقل قول:حتی اگر بعد خزیده شدن هم اون لینک حذف بشه جزء سوابق روبات محسوب میشه
این به همون موضوع catch (شایدم، cache، یادم نیست چی بود) "نسخه ذخیره شده" ربط داره؟ اینم از اون موضوع هایی هست که خیلی ذهنم رو درگیر میکنه، این نسخه ذخیره شده های گوگل یه دیتابیس قوی میخواد، البته گوگل که چپش پره!!!

مگه اینکه مثلاً بیاد لینک های Main مثل انجمن کد نویسی رو باز کنه، بعد بصورت رندوم از نتایج fetch شده اون انجمن باز یکی رو باز کنه...

اگه رندوم نباشه، مثلاً نباید پروفایل یه کاربر معمولی مثلاً BackDoor ایندکس شه...
هر که با مرغ هوا دوست شود - خوابش آرامترین خواب جهان خواهد بود.
  پاسخ
تشکر شده توسط :
#8
نقل قول:ببین میگی روبات در لحظه نمیتونه لینک رو قاپ بزنه...
خب آخه مثلاً تو این سایت هر چی لینک هست در لحظه ایجاد میشه میشه دیگه!
با گوگل وبمستر کار نکردی مگه؟ بخشی داری حتی خودت ساعت ورود و خروج روبات گوگل رو مشخص میکنی. پس ساعت داره. ولی بطور پیشفرض خودش تشخیص میده در چه ساعتی از شبانه روز بهتره که مراجعه کنه. (ملاک تشخیص ساعتشم من والا نمیتونم خوب حدس بزنم)

نقل قول:بعدم اینکه این لینک ها تو سرور که نیستن، یه سری داده از دیتابیس میگیریم، میریزیم تو یه قالب میفرستیم به Client Side ، در واقع فقط قالب خالی تو سرور هست، نمیتونم با موضوع ارتباط برقرار کنم؟
دقیقاً. نتونستی با موضوع ارتباط برقرار کنی. تو الآن سورس همین صفحه رو ببین. چند تا برچسب <a> میبینی؟ مقدار خصیصه href شون رو دنبال کن (تبریک میگم تو الآن نقش یه روباتو بازی کردی Wink ) دقیقاً همینطوره. روبات سورسی که ما میبینیم میبینه. غیر از اینم ممکن نیست.

نقل قول:این به همون موضوع catch (شایدم، cache، یادم نیست چی بود) "نسخه ذخیره شده" ربط داره؟ اینم از اون موضوع هایی هست که خیلی ذهنم رو درگیر میکنه، این نسخه ذخیره شده های گوگل یه دیتابیس قوی میخواد، البته گوگل که چپش پره!!!
cache درست تره Smile ولی اونی نیست که منظور منه. درسته ذخیره میشه و در سوابق روباتش قرار میگیره ولی اون کش که میاد آخرین ذخیره رو بهت نشون میده (با دستور cache:website.com در گوگل سرچ کن) منظورم نیست. البته ممکنه گوگل تصمیم گرفته باشه فقط یه کش از هر پیج داشته باشه، ممکنه هم تصمیم گرفته چندین کش داشته باشه. من نمیدونم اینو.
غایب
  پاسخ
تشکر شده توسط : hamid_80386
#9
نقل قول:دقیقاً. نتونستی با موضوع ارتباط برقرار کنی
دقیقاً بعد از اینکه توضیح دادی قضیه رو گرفتم WinkHeart
ببین پس گوگل نمیاد تو دایرکتوری های هاست ما گشت و گذار کنه، عینهو یه آدم، میاد با لینکای ما ارتباط برقرار میکنه، در واقع یه جورایی میشه همون حدسی که تو پست قبل از پست تو زدم دیگه؟
هر که با مرغ هوا دوست شود - خوابش آرامترین خواب جهان خواهد بود.
  پاسخ
تشکر شده توسط :
#10
نقل قول:دقیقاً بعد از اینکه توضیح دادی قضیه رو گرفتم
آره تقریباً خدا رو شکر Angel

نقل قول:ببین پس گوگل نمیاد تو دایرکتوری های هاست ما گشت و گذار کنه، عینهو یه آدم، میاد با لینکای ما ارتباط برقرار میکنه، در واقع یه جورایی میشه همون حدسی که تو پست قبل از پست تو زدم دیگه؟
خب ببین گوگل مستقیم رو سرور ما پا نمیذاره ولی تو فایل robots.txt میتونی دسترسی به بعضی فولدر ها یا فایل ها رو ببندی براش. نه به این معنی که روبات به اونا دسترسی داره، نه. الآن این صفحه فرضاً با فایل showThread.php که درون فولدر thread هست نشون داده و اجرا میشه. خب شما تو اون فایل مربوط به روبات (robots.txt) میای دسترسیشو به فولدر thread میبندی. حالا دیگه دسترسی چون به این صفحه نداره هرچقدرم لینک باشه به اینجا اصلاً نمیتونه سورسشو ببینه. ولی شاید ممکنه اینجور لینک هارو گوگل تصمیم گرفته باشه سیو کنه تا بعداً دوباره ازشون بازدید کنه. نمیدونم.
غایب
  پاسخ
تشکر شده توسط : hamid_80386


پرش به انجمن:


کاربران در حال بازدید این موضوع: 1 مهمان