اطلاعات رفتار کاربر به عنوان شاخصی برای رتبه گوگل

تمام این متن صرفا شامل نقطه نظرات نویسنده است و ممکن است همیشه دیدگاه Moz را بیان نکند.

پرسش: موتور های جست و جو چگونه تجربه ی کاربر را تحلیل و تفسیر می کنند؟
پاسخ: با جمع آوری و پردازش اطلاعات فعالیت کاربر.


موتور های جست و جو برا ی این کار از انواع مختلف اطلاعات فعالیت کاربر شامل رتبه بندی بر اساس میزان کلیک( CTR )، مسیرهای ناوبری، زمان، مدت، فراوانی و نوع دسترسی استفاده می کنند.

رتبه بندی بر اساس میزان کلیک

تحلیل و رتبه بندی بر اساس تعداد کلیک یکی از مهم ترین شاخصه های کیفیت بازخورد جست و جو در مقالات بازیابی اطلاعات تجاری و دانشگاهی است. گوگل و مایکروسافت، هر دو، تلاش های فراوانی جهت ارتقاء ساز و کارهایی کردند که به کمک آن ها می توان دریافت چه زمانی یک صفحه میزان CTR بالاتر یا پایین تر از حد انتظار کسب کرده.

تمایل به موقعیت مکانی

میزان CTR تا حد زیادی تحت تاثیر موقعیت مکانی است، زیرا کاربران تمایل به انتخاب نتایجی دارند که در مکان های بالاتر قرار می گیرند. به این پدیده تاثیر موقعیت مکانی می گویند و موردی است که پذیرش CTR را به عنوان شاخصی کاربردی برای رتبه بندی سایت ها دشوار می کند. اماخبر خوب این که موتورهای جست و جو روش های متعددی برای مقابله با این مسئله دارند. در سال ۲۰۰۸، مایکروفاست دریافت که “مدل آبشار” در این مورد بهترین کاربرد را دارد. این مدل،بر خلاف کاهش اندک میزان اطمینان به نتایج با رتبه های پایین تر، بدون نیاز به داده های آموزشی و پارامتر به خوبی کار می کند. در حقیقت، ویژگی مهم این مدل این است که روشی ارزان و موثر برای حل مسئله ی تمایل به موقعیت مکانی ارائه می کند که CTR را عملا کاربردی تر می کند.

جذابیت نتایج

CTR خوب یک تعریف نسبی است. برای یک نتیجه در موقعیت مکانی بالا در گوگل، CTR 30% طبیعی است، مگر این جستجوی عین برند مورد نظر باشد که در این صورت CTR بسیار بدی خواهد بود. بدین ترتیب، چنین میزانی برای شرایط رقابتی اگر میان موارد با درجه جذب بالای مخاطب قرار بگیرد(مانند: چارت های پاسخ، پنل های علمی یا گروه های محلی)، بسیار بالا خواهد بود.
۵ سال به مشاهده و بررسی دقیق داده های CTR در زمینه وابستگی اش به مکان، ویژگی های جزئی و ویژگی های خاصِ جست و جو ،پرداختم. طی این دوره، به این نتیجه رسیدم که اگاهی از زمان وقوع انحراف از معیار بسیار مهم است. علاوه بر رتبه بندی مکانی، درنظر گرفتن دیگر عناصر که می تواند بر انتخاب کاربر برای کلیک روی یک نتیجه موثر باشد نیز ضروری است:
• ویژگی های جزئی
• ارتباط مفهومی
• وجود ویژگی های خاص در نتایج جست و جو
• تشخیص برندها
• شخصی سازی

برنامه های کاربردی

جذابیت نتایج جست و جو یک موضوع دانشگاهی صرف نیست. پژوهش های CTR اگر به درستی انجام شوند، می توانند برای یک بازاریاب مدرن بسیار با ارزش باشند. در این جا یک نمونه پژوهش موردی قرار داده شده که در آن فایده ی انحراف متوسط CTR را در مراحل جست و جوی عبارت و هدف گیری صفحات نشان داده ام.

مطالعه ی “برجسته سازی عنوان” در نتایج گوگل

Google-CTR-study

گوگل نیز از معیارهای اضافی برای کمک به تمایل به جذابیت آگاه است و تلاش بسیاری برای ارائه ی راه حل هایی در جهت رفع تمایل به کلیک کردن بر اساس موقعیت مکانی کرده است.
مهندسان گوگل تمایل زیادی به یافتن راه هایی برای بهبود تاثیر شاخص های رتبه بندی که بر اساس CTR عمل می کنند از خود نشان دادند. آن ها علاوه بر حل مشکل تمایل به انتخاب بر اساس موقعیت مکانی، با برجسته سازی جزئی از عناوین جست و جو SERP به عنوان معیار تمایل به جذابیت در نتیجه، گامی فراتر نهادند. به نظر من این اقدام اخیر گوگل که حذف برجسته سازی عناوین نتایج جست و جوی آنی است و احتمال حذف تمامی تفاوت ها را فراهم می کند، اقدامی جالب است. مقاله ی آن ها ارزش این کار را در پژوهش های بعدی که روی آثار تفاوت های ویژگی های جزئی SERP متمرکز هستند برجسته تر می کند.

تعداد دسترسی آدرس (URL)، مدت، فراوانی و مسیر

داده های به دست امده از کلیک ها تنها شاخص کاربردی فعالیت کاربر نیست. برای مثال، طول دوره ی استفاده اگر به درستی اندازه گیری شود، معیار سنجشی بسیار ارزشمند است. برای مثال، زمانی که کاربر به صفحه ای هدایت می شودو زمانی که برای صرف ناهار محل را ترک می کند و صفحه را به حالت اماده باش نگه می دارد، اینجاست که سیستم های مانیتوری فعال بسیار مفید واقع می شوند.
شاخص های کمکی فعالیت کاربر بسیاری وجود دارند که ممکن است قابل نمایه سازی نباشند. مانند: اندازه گیری زمان تعامل کاربر در صفحات که شامل انواع مختلف فعالیت ها با صفحه کلید، موس، صفحه ی لمسی، تبلت، قلم و دیگر رابط هاست.
اخیرا جان مولر در گوگل چنین توضیح داد که تعامل کاربر شاخص رتبه بندی مستقیمی نیست. و من چنین تصور می کنم که منظور او از این گفته این است که این نوع داده ها(زمان صرف شده در یک صفحه، پر کردن فرم، کلیک کردن و …) به صورت خودکار عمل نمی کنند.

در این مرحله از زمان، ما احتمالا بیشتر به مدل “سند باکس” نگاه می کنیم، نه یک موسیقی زنده و درمورد سیستم عکس العمل زمانی که درباره ی تاثیر مستقیم فعالیت کاربر در یک صفحه ی خاص است صحبت می کنیم. گوگل به این شکل به محدودیت هایی در نتایج ارزیابیِ کیفیتِ ارزیاب و ارزیابی بر پایه مدل”سند باکس” اذعان کرد. مهندسان گوگل اخیرا سیستم یادگیری فعالی را پیشنهاد کردند که نتایج را به سرعت و به همراه نمونه ای که معرف بهتری از پایگاه کاربری است ارزیابی می کند.
«یک راهبرد دیگر برای فعالیت های اتی، تاسیس یادگیری فعال به منظور جمع آوری نمونه ای است که معرف بهتری برای حضور کاربر باشد.»
مقاله ی جذابیت نتایج گوگل در سال ۲۰۱۰ منتشر شد. در اوایل سال ۲۰۱۱، گوگل الگوریتم پاندا را به بازار ارائه کرد. بعدها در همان سال، پاندا با استقبال زیادی مواجه شد که نشان دهنده ی پیاده سازی شکلی از سیستم یادگیری فعال است. از سیستم های گوگل می توان انتظار داشت که در آینده بیش از این فعالیت کنند.

موتور نظارت

گوگل سیستمی را طراحی و اختراع کرد که به جمع آوری و پردازش اطلاعات فعالیت کاربر می پردازد. آن ها این سیستم را موتور نظارت نامیدند، اما من این نام را نمی پسندم زیرا بسیار طولانی است، شاید بهتر باشد آن را کروم بنامند.
این اختراع که تحت حق ثبت است موتور نظارت گوگل را که به سختی قابل خواندن است توصیف می کند. (اگر زمان ندارید می توانید نکات مهمی که تهیه کرده ام را بخوانید.)

سرویس استاندارد

اجازه دهید لحظه ای از این اختراع گوگل گذشته و لحظه ای به آن چه در دنیای بیرون می گذرد نگاه کنیم. سرویس استاندارد کروم سیستمی است که مسئول به دست اوردن و ارسال گزارش داد های کاربر است. پیشینه نما های ارسال شده شامل جزئیات فراوانی از فعالیت های ثبت شده ی کاربر مانند برگه های باز و بسته شده، آدرس صفحات وب مورد استفاده، پنجره های بزرگنمایی شده و … است.
این آدرس را در کروم وارد کنید:
chrome://histograms/
(برای کسب اطلاعات فنی اینجا کلیک کنید)
دراینجا چند لینک دیگر با جزئیات اطلاعات درباره ی کروم قرار داده شده است:
Chrome’s MetricsService, reasons and types of data collection, and a full list of histograms

استفاده در رتبه بندی

گوگل می تواند داده ها را در طرحی بردار مانند با استفاده از نقاط(آدرس های صفحات وب)، لبه ها(لینک ها)و برچسب ها(داده های فعالیت کاربر) پردازش کند. نشان های صفحه ی در حال استفاده، مانند ارزش زمانی مدت استفاده که برای محاسبه ی وزن نقاط از آن استفاده می شود. در این جا دو نوع نمودار ساده شده شامل سه نقطه(A, B, C) با برچسب زمانی که به هرکدام الصاق شده، مشاهده می کنید.

nodes
در مدل نمودار هدایت نشده(لبه های هدایت نشده)، وزن نقطه ی A مستقیما از محل مقدار برچسب عبور کرده(مدت فعالیت ۱۲۰ ثانیه بوده). در نمودار هدایت شده(لبه های هدایت شده)، نقطه ی A به نقطه ی B و C متصل شده است. با انجام چنین کاری، از نقاطی که به هم متصل می شوند، ارزش برچسب زمانی حاصل می شود.
به زبان ساده، اگر وارد صفحاتی شوید که مردم زمان زیادی در آن ها هستند، گوگل بخشی از اعتبار زمانی را به اتصال به آن صفحات اختصاص می دهد. به همین دلیل است که پیوند به محتوای در حال استفاده و مفید فکر خوبی است.
نکته جالب این است که علامت کیفیت ضمنی صفحات پایین تر نیز به جمع صفحات بالاتر پیوند داده می شود.

مدل پیمایشگر استاندارد

پیمایشگر استاندارد جانشین پیمایشگر تصادفی است. عامل محدودکننده ی رتبه ی صفحه نشان دهنده ی این فرضیه است که پس از هر لینک دنبال شده، پیمایشگر فرضی به احتمال کمتر روی لینک تصادفی کلیک می کند که منجر به رها شدن احتمالی یک مسیر پیمایش می شود. امروزه، اکثر موتورهای جست و جو با مدل های اصلاح شده تر کار می کنند که شامل انواع بیشتر عوامل موثر است. برای مثال، تمایل به کلیک روی یک لینک درون صفحه می تواند به عوامل زیر وابسته باشد:
• مکان قرارگیری لینک در صفحه(بالا، پایین، زیر یا بالای فولد)
• موقعیت لینک در صفحه(منو، نوار جانبی، پانویس، محدوده ی محتوا، فهرست)
• اندازه ی متن لنگر
• اندازه ی فونت، سبک و رنگ
• تطابق موضوعی
• ویژگی های آدرس صفحه ی وب(داخلی/ خارجی/ فاصله گذاری/ دامنه ی سطح بالا(TDL)، طول، تغییر مسیر، میزبان(host))
• لینک تصویری، اندازه و نسبت ابعاد
• تعداد لینک های موجود در صفحه
• واژه های موجود در محدوده ی لینک، واژه های عناوین و سرفصل ها
• تجاری بودن متن لنگر
یک موتور جست و جو علاوه بر اهمیت مشهود سیگنال های صفحات اینترنتی، ممکن است محبوبیت یک لینک را توسط انتخاب های مشترک کاربران بسنجد. لینکی که کاربران بیشتر روی آن کلیک می کنند می تواند بار بیشتری نسبت به لینکی با تعداد کلیک کمتر داشته باشد. گوگل به طور اختصاصی به بررسی فعالیت کلیک کاربران در محتوا ی متعادل سازی سنتی، سیگنال های دستکاری شده ی بیشتر، مانند: لینک ها، اشاره می کند.
در تصویر زیر دولینک خارج از محدوده را در سندی یکسان می بینیم که A به B و C اشاره دارد. در سمت چپ، آن چه در مدل قدیمی پیمایشگر تصادفی اتفاق می افتد را مشاهده می کنید، در حالی که در سمت راست، لینکی موجود است که در موقعیت حساس تری قرار دارد و به نظر می رسدبسیاری از بازدید کنندگان صفحه، آن را انتخاب کرده و ترجیح داده اند.

link-nodes
از این روش می توان در سند نشانه یا حوزه های گسترده تر و همچنین برای کاربرد تک کاربر(خصوصی سازی) و گروه های(دسته های) کاربری تعیین شده به وسیله زبان، تاریخچه ی جست و جو و علایق استفاده کرد.

الصاق پوگو

یکی از گویا ترین سیگنال ها برای موتورهای جست و جو زمانی است که کاربران پرسش مطرح می کنند وپس از این مشاهده ی صفحه ای که نیاز آن ها را برآورده نکرده به سرعت به نتایج جست و جو باز می گردند.این اثر پیش تر مورد بحث و بررسی و توصیف قرار گرفت و آزمایش های متعددی تاثیر آن را در عمل نشان داد. بسیاری افراد اعتبار و درستی آزمایش های SEO را به دلیل اجرای غیر علمی و اختلال کلی داده ها زیر سوال می برند. اما خوب است بدانیم که این اثر در رادار گوگل وجود داشته است.

نوار آدرس

داده های آدرس صفحه ی وب می تواند شامل این باشد که آیا یک کاربر آدرس را در نوار مرورگر وب تایپ می کند یا با کلیک روی لینک در صفحه ی وب دیگر یا توسط لینکی در پیام الکترونیکی به صفحه دسترسی پیدا می کند. برای مثال اگر کاربران آدرس دقیق را تایپ کنند و دکمه ی اینتر را بزنند سیگنال قوی تری نسبت به زمانی که از طریق پیشنهادها و نتایج(فهرست) ارائه شده در مرورگر به صفحه دسترسی پیدا کنند منعکس می شود.
• نوشتن کامل آدرس اینترنتی صفحه ی وب(امتیاز کامل)
• نوشتن بخشی از آدرس اینترنتی صفحه ی وب با کامل کردن خودکار(امتیاز متوسط)
• دنبال کردن یک لینک(امتیاز پایین)

صفحات لاگین(ورود به سایت)

گوگل، کاربران و نقشه های مسیر آن ها را هنگامی که در شبکه ی اینترنت به جست و جو می پردازند را بررسی می کند. آن ها می دانند که چه زمانی کاربران وارد صفحه ای می شوند(مثلا شبکه های اجتماعی) و چه زمانی کارشان پایان یافته و از صفحه خارج می شوند. اگر یک مسیر همیشه با صفحه ی ورود شروع شود، گوگل به صفحات ورود امتیاز بالاتری در رتبه بندی اختصاص می دهد.
یک صفحه ی ورودی می تواند مسیر، توالی و صفحات مرتبط یک کاربر را آغاز کند و ممکن است حتی برای کاربر نسبت به صفحات مرتبط مهم تر باشد، بنابراین امتیاز بالاتری در رتبه بندی کسب می کند.
به نظر من این موضوع جالب است. در حقیقت، زمانی که این مطلب را می نوشتم در حال طراحی آزمایش ورود به صفحه ای بودم تا ببینم آیا دسترسی مکرر کاربر و تعامل در صفحه به هر نحوی تاثیری بر قابلیت دیده شدن صفحه دارد یانه. کسانی که این مقاله را می خوانند می توانند با نام کاربری: Moz و رمز عبور: Moz123 وارد تست صفحه ی ورودی شوند.
ایده ای که در آزمایش من نهفته است این است که تمام سیگنال های ذکر شده در این مقاله آزمایش شوند.
• آشنایی با آدرس صفحه ی وب، ورود مستقیم برای بالاترین امتیاز
• راه اندازی و دسترسی مکرر کاربران
• طول دوره ی زمانی پیش بینی شده بین ۳۰ تا ۱۲۰ ثانیه
• افزایش میزان اعتبار با افزایش زمان بازگشت به صفحه ی اصلی
• عناصر تعاملی افزوده شده به فعالیت(بیرون بردن، تعامل چارت و فیلتر ها)

ترکیب سیگنال های رتبه بندی ضمنی و قدیمی

گوگل داده های تولید شده توسط کاربران را با درجه های متفاوت اهمیت تلقی می کند. ترکیب سیگنال های ضمنی مانند روزهای هفته، طول دوره ی فعالیت، تعداد بازدید یا نوع موضوع با روش های رتبه بندی قدیمی، اعتبار نتایج جست و جو را بالا می برد.

page-quality-metrics
تاثیر بر SEO

حقیقت سیگنال های حرکتی موجود در رادار گوگل بر اهمیت رو به رشد بهینه سازی تجربه کاربر تاکید دارد. کار ما، تشویق کاربر برای کلیک کردن، تعامل، تکرار و مراجعه ی دوباره به صفحه است. این وظیفه ی پیچیده، نیازمند ترکیب چند رشته ای، شمال مهارت های فنی، استراتژیکی و خلاقانه است. ما نیز هم توسط کاربران و هم توسط موتورهای جست و جو مورد ارزیابی قرار گرفته ایم و هر آن چه کاربران در صفحه ما انجام می دهند نیز محسوب می شود. ارزیابی از سطح SERP آغاز شده و کاربران را طی تمام مدت زمانی که در سایت شما هستند دنبال می کنند.

“تجربه ی کاربری خوب”

قابلیت رؤیت جست و جو هیچگاه وابسته به تجربه ی شخصی کاربر نخواهد بود، بلکه به تفسیر و ترجمه ی موتورهای جست و جو از آن وابسته است. تازه ترین پژوهش ها در این باره که مردم چگونه به صورت آنلاین مطلبی را می خوانند حاکی از آن است که کاربران عکس العمل خوبی نسبت به مطالعه ی متون با حجم بالا نشان نمی دهند(این مقاله نیز شامل این مورد است). کاربران نگاهی اجمالی به متن خواهند انداخت و اگر پاسخ سوالشان را به سرعت نیابند، فورا صفحه را ترک خواهند کرد. این نوع رفتار می تواند علامت بدی برای صفحه ی ما باشد.
راه حل من این بود که برای تمامی کاربران قالبی از محتوا همراه با محتوای تکمیلی مقدور بر اساس درخواست کاربر از متن اصلی تهیه کنیم. در نتیجه، صفحه ی آزمایشی ما(۵۰۰۰ کلمه) زمان متوسط استفاده ی هر کاربر را از ۶ دقیقه به ۱۲ دقیقه افزایش و میزان گزافه گویی را از ۹۰ درصد به ۶۰ درصد کاهش یافت. در این مقاله که ما یافته هایمان را منتشر کرده ایم، نشان داده شده که کلیک ها، شناور ماندن ها و ثبت عمق فعالیت دوباره و سه باره به سایر محتوایی که تهیه کرده ایم ارزش و اعتبار می بخشد. از نظر من، این به اندازه کافی قانع کننده است.

clicks-1024x574
با این حال، الگوریتم های گوگل مخالف این موضوع هستند و ارزش محتوای غیر قابل رویت درون صفحه را به صورت پیش فرض کاهش می دهند. پرسش هایی وجود دارند که شامل بخش های بسط نیافته در جزئیات SERP هستند که برجسته نشده اند و اخیرا مانند صفحاتی که همان محتوا را قابل رویت کرده اند رتبه بندی نمی شوند. این موردی است که گوگل سرانجام باید روی ان کار کند اما در حال حاضر ما باید به این خلاء مشهود بیاندیشیم و در مواردی که تجربه ی مطلوب کاربر با بهترین فعالیت های گوگل مطابقت ندارد تصمیم حساب شده ای بگیریم.

ترجمه از :  معصومه ناظری
منبع : وبلاگ موز

مقالات مرتبط
• Ranking documents based on user behavior and/or feature data, Google, 2010
• Active Exploration for Learning Rankings from Clickthrough Data, Cornell, 2007
• Beyond Position Bias, Google, 2010
• An Experimental Comparison of Click Position-Bias Models, Microsoft, 2008
• Improving Searcher Models Using Mouse Cursor Activity, Microsoft, 2012
• Inferring Search Behaviors Using Partially Observable Markov (POM) Model, Microsoft, 2010
• A Dynamic Bayesian Network Click Model for Web Search Ranking, Yahoo!, 2009
• Modifying search result ranking based on implicit user feedback and a model of presentation bias, Google, 2015