آشنایی با مفهوم Scope و کاربردهای آن در GA4
در کنار یادگیری قسمتهای مختلف گوگل آنالیتیکس ن...
هنگام کار با گزارشهای مختلف GA4 ممکن است با پیام Data sampling روبرو شوید که خبر میدهد مقداری از اطلاعات گزارش شما نمایش داده نمیشود. در کنار امکانات بیشماری که آنالیتیکس جدید GA4 در ردیابی اقدامها و رفتار کاربران سایت و اپلیکیشن در اختیار ما قرار میدهد، به دلیل رایگان بودن ابزار با محدودیتهایی نیز روبرو هستیم که آشنایی با آنها و روشهای دور زدن این محدودیتها میتواند کمک زیادی به ما کند.
در این مقاله قصد داریم تا با انواع Sample شدن دیتا در GA4، دلایل رخ دادن کامل نبودن بعضی گزارشها و روشهای حل این مشکلات آشنا شویم. اگر شما هم با انواع مختلف Data sampling روبرو شدهاید، حتماً با این مقاله همراه ما باشید.
بهصورت کلی زمانی که Sampling رخ میدهد، به این معنی است که اطلاعات کامل گزارش به شما نمایش داده نشده و تنها نمونهای از کل اطلاعات قابلمشاهده است. در این حالت قسمتی از اطلاعات از دست رفته که ممکن است تحلیل شما را دچار مشکل کند.
در GA4 بالای هر گزارش استاندارد یا گزارشهای اختصاصی بخش Explore یک علامت تیک سبزرنگ مانند تصویر وجود دارد که نشان میدهد، اطلاعات این گزارش دچار Sampling نشده است.
اما در بعضی مواقع این علامت به مثلث قرمزرنگی تبدیل میشود که با کلیک روی آنها با پیام ایجاد محدودیت در گزارش روبرو میشوید.
در GA4 سه نوع محدودیت مختلف وجود دارد که بخشی از اطلاعات گزارش را نمایش نمیدهد. در قسمت بعد با این محدودیتها آشنا میشویم.
سه محدودیت زیر ممکن است در گزارشهای GA4 شما ایجاد شود:
در ادامه این موارد را آموزش داده و بهصورت اختصاصی روشهای حل مشکل Hit limit را که موضوع اصلی مقاله است، بررسی میکنیم.
این محدودیت که در گزارشهای استاندارد و Explore ممکن است به وجود بیاید، باعث میشود تا به دلیل حفظ حریم شخصی کاربران ردیفهایی از گزارش که تعداد کاربر کمی دارند، قابلمشاهده نباشد. در این حالت در بالای گزارش با پیامی مانند تصویر زیر روبرو میشوید.
علت ایجاد Thresholding فعالسازی گوگل سیگنال است که چون اطلاعات بیشتری از کاربران جمعآوری میشود، برای به مشکل نخوردن قانون حریم شخصی، این محدودیت توسط GA4 به وجود میآید. در مقاله آموزش Thresholding در GA4 بهصورت کامل به این محدودیت و روشهای مختلف حل آن میپردازیم که در صورت نیاز میتوانید به این مقاله سر بزنید.
این محدودیت زمانی رخ میدهد که یک دایمنشن گزارش، دارای مقادیر یکتا زیادی باشد که تعداد ردیفها و صفحههای جدول را زیاد کند. در این حالت اطلاعات تعدادی از ردیفهای آخر جدول که مقادیر کمتری دارند با هم تجمیع شده و در یک ردیف با مقدار other در گزارش نمایش داده میشوند که به آن محدودیت High-cardinality گفته میشود.
پس برخلاف محدودیت Thresholding، در این محدودیت اطلاعات از گزارش حذف نمیشوند و فقط ردیفهای اضافه باهم جمع شده و ردیف other را میسازند. برای دایمنشنهای پیشفرض GA4 معمولاً این اتفاق نمیافتد، چون اکثر آنها مقادیر یکتای زیادی ندارند. برای دایمنشنهایی مانند Page path که آدرس صفحه را نمایش میدهند، ممکن است در سایتهای با تعداد صفحات خیلی زیاد، مشکل High-cardinality ایجاد شود.
اما در هنگام ساخت دایمنشنهای اختصاصی، GA4 پیشنهاد میدهد که مراقب این موضوع باشید و دایمنشنی با مقادیر مختلف زیاد را ارسال نکنید. مثلاً نباید برای هر کاربر یا سشن، یک آیدی اختصاصی ساخته و آن را بهعنوان Custom dimension معرفی کنید. بهجای آن پیشنهاد میشود که از قابلیتهایی مثل User ID استفاده کنید که متفاوت با دایمنشن است.
این محدودیت که موضوع اصلی مقاله است، به معنای واقعی اطلاعات را Sample شده گزارش میدهد؛ یعنی درصدی از کل اطلاعات را بهعنوان نمونه نمایش داده و این درصد را در بالای گزارش با کلیک روی آیکون Sampling نشان میدهد. ابتدا به این سؤال پاسخ دهیم که Hit limit چه زمانی و در چه گزارشی ممکن است رخ دهد؟
برخلاف نسخه یونیورسال آنالیتیکس که این محدودیت در گزارشهای استاندارد برای سایتهای با حجم اطلاعات بالا رخ میداد، در GA4 گزارشهای استاندارد هیچ محدودیتی نداشته و تمام اطلاعات جمعآوریشده کاربران بهصورت کامل در آنها قابلمشاهده است که این مزیت بسیار خوبی برای سایتهای بزرگ و پرترافیک به شمار میرود.
اما در گزارشهای بخش Explore که بهصورت اختصاصی ساخته میشوند و دارای ترکیب دایمنشن و متریکهای متفاوت و مختلف هستند، Hit limit خودش را نشان میدهد.
اگر در بازه زمانی که برای گزارش Explore انتخاب کردید، بیشتر از ده میلیون ایونت به پراپرتی GA4 ارسال شده باشد، گزارش شامل Sampling شده و ابتدا ده میلیون ایونت بهعنوان نمونه انتخاب میشود و اطلاعات گزارش بر اساس این نمونه ساخته و نمایش داده میشوند.
نکته: اگر گزارشی که در Explore ساختید، کاملاً شبیه یک گزارش استاندارد باشد، دچار Sampling نخواهد شد و مشابه گزارش استاندارد عمل خواهد کرد.
نکته: فیلترها و سگمنتهای اعمالی در گزارش نمیتواند با کاهش ایونتها محدودیت Sampling را از بین ببرد. ملاک فقط تعداد کل ایونت ارسالشده در بازه زمانی گزارش است و اگر این مقدار بیشتر از ده میلیون باشد، Sampling رخ میدهد و سپس سگمنتها و فیلترها روی دیتا نمونهگیری شده اعمال میشوند.
اکنونکه با علت ایجاد Hit limit آشنا شدید، در قسمت آخر مقاله به روشهای حل این مشکل Sampling اشاره میکنیم.
چهار روش برای برخورد با Hit limit وجود دارد که اگر در یک گزارش اختصاصی بخش Explore با این محدودیت مواجه شدید، بتوانید با یکی از این روشها مشکل گزارش را حل کنید.
اگر درصد کمی از اطلاعات گزارش شامل Sampling شده باشد، میتوانید این محدودیت را نادیده بگیرید؛ چراکه تأثیر زیادی در تحلیل اطلاعات گزارش نخواهد داشت. با رفتن روی آیکون بالای گزارش میتوانید ببینید چند درصد از اطلاعات در نمونهگیری انجامشده قابلمشاهده است و سپس تصمیم بگیرید که محدودیت را نادیده بگیرید یا خیر؟ حتی در درصدهای کمتر هم اگر به نحوه نمونهگیری GA4 اعتماد کنید، میتوانید تحلیل را بر اساس مقادیر کمتر اطلاعات نیز انجام دهید.
همانطور که گفته شد زمانی Sampling رخ میدهد که در بازه زمانی گزارش بیشتر از ده میلیون ایونت جمعآوریشده باشد. پس میتوانید با کاهش بازه زمانی، این مقدار را به کمتر از ده میلیون برسانید که دیگر گزارش شامل Sampling نشود. البته این روش به این شرط جوابگو خواهد بود که مشکلی با تغییر بازه زمانی گزارش نداشته باشید؛ در غیر این صورت اگر به هر دلیلی نمیتوانید زمان گزارش را کم کنید، به سراغ روشهای دیگر بروید.
یکی از اصلیترین روشهایی که میتواند هم احتمال Sample شدن اطلاعات را کاهش دهد و هم نظم بهتری به آنها بدهد، روش فیلتر کردن ایونتهای جمعآوریشده است. نکته مهمی که در هنگام تنظیم و ارسال ایونتها به GA4 باید به آن دقت کنید این است که فقط اقدامهایی از کاربر را ردیابی کنید که به آنها نیاز دارید. ردیابی اقدامهای بیاهمیت یا غیر مهم کاربر فقط باعث سخت کردن تحلیل اطلاعات و خراب شدن ساختار و نظم آنها میشود. همچنین تعداد ایونتها که افزایش یابد، باعث Data sampling نیز میشود.
پس اگر با این محدودیت روبرو هستید، یکبار تمامی ایونتهایی که به GA4 ارسال میکنید را بررسی کنید و ایونتهای غیرضروری و با تعداد تکرار بالا را تا حد ممکن حذف کنید.
مثلاً یکی از ایونتهایی که میتواند تعداد کل ایونتهای شما را بهشدت زیاد کرده و اهمیت زیادی هم نداشته باشد، ایونت اسکرول است که میزان اسکرول کاربر در صفحات را اندازهگیری میکند. اگر برای صفحات زیادی درصدهای مختلفی از اسکرول را ردیابی کنید با مقدار زیادی ایونت مواجه میشوید که احتمال Data sampling را افزایش میدهد.
پس ایونتهایی مانند کلیک و اسکرول را فقط برای صفحات و موارد مهم ردیابی کنید. با این کار میتوانید در ادامه حتی برای بازههای زمانی بزرگتر نیز بدون Sampling گزارشها را تحلیل کنید.
اگر هیچیک از روشهای قبلی مناسب شما نبودند و با سایت پرترافیک و بزرگی روبرو هستید که مقدار ایونتهای ضروری آن زیاد است، میتوانید از روش آخر یعنی اتصال GA4 به Big Query استفاده کنید.
یکی از قابلیتهای مهم GA4 که در نسخه قبلی وجود نداشت، اتصال رایگان پراپرتی نسخه جدید به ابزار Big Query است. با این کار تمامی اطلاعات جمعآوریشده در GA4 بدون Sampling و بهصورت کامل در دیتابیس Big Query ثبت میشوند و شما میتوانید با تسلط به این ابزار و دانش SQL گزارشهای موردنیازتان را بسازید و دیگر محدودیت ده میلیون ایونت برای این ابزار وجود ندارد.
البته اتصال به GA4 رایگان است؛ اما اگر استفاده از اطلاعات و ساخت گزارش در ماه از یک حد معین بیشتر شود، مجبور به پرداخت هزینه و خرید اشتراک برای اعمال SQL های جدیدتر میشوید. برای سایتهای بزرگ و پرترافیک که میتوانند هزینه این ابزار را پرداخت کنند، امکانات بیشمار ابزار Big Query کاربردهای زیادی خواهد داشت و میتواند در ساخت گزارشهای پیشرفته و ترکیب اطلاعات با منبعهای دیگر کمک کند.
در این مقاله با انواع محدودیتهایی که میتواند نمایش کل اطلاعات گزارش را در GA4 با مشکل روبرو کند، آشنا شدیم و بعد از بیان دلیل رخ دادن هر محدودیت، روشهای حل این مشکلات را بررسی کردیم. بههرحال در کنار قابلیتهای کاربردی و رایگانی که GA4 در اختیار ما قرار میدهد، کنار آمدن با این محدودیتهایی که یا تأثیر کمی در تحلیل ما داشته و یا روشهایی برای حل آن وجود دارد، منطقی و عاقلانه است. اگر در مورد این مقاله سؤالی برایتان پیش آمد، حتماً در قسمت نظرات آن را برای ما ارسال کنید.
تمام حقوق مادی و معنوی این وب سایت متعلق به آنالیتیپس است.
حرفی، سخنی، سوالی؟