هنگام کار با گزارش‌های مختلف GA4 ممکن است با پیام Data sampling روبرو شوید که خبر می‌دهد مقداری از اطلاعات گزارش شما نمایش داده نمی‌شود. در کنار امکانات بی‌شماری که آنالیتیکس جدید GA4 در ردیابی اقدام‌ها و رفتار کاربران سایت و اپلیکیشن در اختیار ما قرار می‌دهد، به دلیل رایگان بودن ابزار با محدودیت‌هایی نیز روبرو هستیم که آشنایی با آن‌ها و روش‌های دور زدن این محدودیت‌ها می‌تواند کمک زیادی به ما کند.

در این مقاله قصد داریم تا با انواع Sample شدن دیتا در GA4، دلایل رخ دادن کامل نبودن بعضی گزارش‌ها و روش‌های حل این مشکلات آشنا شویم. اگر شما هم با انواع مختلف Data sampling روبرو شده‌اید، حتماً با این مقاله همراه ما باشید.

Data sampling چیست؟

به‌صورت کلی زمانی که Sampling رخ می‌دهد، به این معنی است که اطلاعات کامل گزارش به شما نمایش داده نشده و تنها نمونه‌ای از کل اطلاعات قابل‌مشاهده است. در این حالت قسمتی از اطلاعات از دست رفته که ممکن است تحلیل شما را دچار مشکل کند.

در GA4 بالای هر گزارش استاندارد یا گزارش‌های اختصاصی بخش Explore یک علامت تیک سبزرنگ مانند تصویر وجود دارد که نشان می‌دهد، اطلاعات این گزارش دچار Sampling نشده است.

 

اما در بعضی مواقع این علامت به مثلث قرمزرنگی تبدیل می‌شود که با کلیک روی آن‌ها با پیام ایجاد محدودیت در گزارش روبرو می‌شوید.

 

در GA4 سه نوع محدودیت مختلف وجود دارد که بخشی از اطلاعات گزارش را نمایش نمی‌دهد. در قسمت بعد با این محدودیت‌ها آشنا می‌شویم.

 

انواع محدودیت نمایش اطلاعات در GA4

سه محدودیت زیر ممکن است در گزارش‌های GA4 شما ایجاد شود:

  • Data Thresholding
  • Cardinality
  • Hit limit

در ادامه این موارد را آموزش داده و به‌صورت اختصاصی روش‌های حل مشکل Hit limit را که موضوع اصلی مقاله است، بررسی می‌کنیم.

محدودیت Thresholding

این محدودیت که در گزارش‌های استاندارد و Explore ممکن است به وجود بیاید، باعث می‌شود تا به دلیل حفظ حریم شخصی کاربران ردیف‌هایی از گزارش که تعداد کاربر کمی دارند، قابل‌مشاهده نباشد. در این حالت در بالای گزارش با پیامی مانند تصویر زیر روبرو می‌شوید.

 

علت ایجاد Thresholding فعال‌سازی گوگل سیگنال است که چون اطلاعات بیشتری از کاربران جمع‌آوری می‌شود، برای به مشکل نخوردن قانون حریم شخصی، این محدودیت توسط GA4 به وجود می‌آید. در مقاله آموزش Thresholding در GA4 به‌صورت کامل به این محدودیت و روش‌های مختلف حل آن می‌پردازیم که در صورت نیاز می‌توانید به این مقاله سر بزنید.

محدودیت Cardinality

این محدودیت زمانی رخ می‌دهد که یک دایمنشن گزارش، دارای مقادیر یکتا زیادی باشد که تعداد ردیف‌ها و صفحه‌های جدول را زیاد کند. در این حالت اطلاعات تعدادی از ردیف‌های آخر جدول که مقادیر کمتری دارند با هم تجمیع شده و در یک ردیف با مقدار other در گزارش نمایش داده می‌شوند که به آن محدودیت High-cardinality گفته می‌شود.

 

پس برخلاف محدودیت Thresholding، در این محدودیت اطلاعات از گزارش حذف نمی‌شوند و فقط ردیف‌های اضافه باهم جمع شده و ردیف other را می‌سازند. برای دایمنشن‌های پیش‌فرض GA4 معمولاً این اتفاق نمی‌افتد، چون اکثر آن‌ها مقادیر یکتای زیادی ندارند. برای دایمنشن‌هایی مانند Page path که آدرس صفحه را نمایش می‌دهند، ممکن است در سایت‌های با تعداد صفحات خیلی زیاد، مشکل High-cardinality ایجاد شود.

اما در هنگام ساخت دایمنشن‌های اختصاصی، GA4 پیشنهاد می‌دهد که مراقب این موضوع باشید و دایمنشنی با مقادیر مختلف زیاد را ارسال نکنید. مثلاً نباید برای هر کاربر یا سشن، یک آی‌دی اختصاصی ساخته و آن را به‌عنوان Custom dimension معرفی کنید. به‌جای آن پیشنهاد می‌شود که از قابلیت‌هایی مثل User ID استفاده کنید که متفاوت با دایمنشن است.

محدودیت Hit limit

این محدودیت که موضوع اصلی مقاله است، به معنای واقعی اطلاعات را Sample شده گزارش می‌دهد؛ یعنی درصدی از کل اطلاعات را به‌عنوان نمونه نمایش داده و این درصد را در بالای گزارش با کلیک روی آیکون Sampling نشان می‌دهد. ابتدا به این سؤال پاسخ دهیم که Hit limit چه زمانی و در چه گزارشی ممکن است رخ دهد؟

برخلاف نسخه یونیورسال آنالیتیکس که این محدودیت در گزارش‌های استاندارد برای سایت‌های با حجم اطلاعات بالا رخ می‌داد، در GA4 گزارش‌های استاندارد هیچ محدودیتی نداشته و تمام اطلاعات جمع‌آوری‌شده کاربران به‌صورت کامل در آن‌ها قابل‌مشاهده است که این مزیت بسیار خوبی برای سایت‌های بزرگ و پرترافیک به شمار می‌رود.

اما در گزارش‌های بخش Explore که به‌صورت اختصاصی ساخته می‌شوند و دارای ترکیب دایمنشن و متریک‌های متفاوت و مختلف هستند، Hit limit خودش را نشان می‌دهد.

اگر در بازه زمانی که برای گزارش Explore انتخاب کردید، بیشتر از ده میلیون ایونت به پراپرتی GA4 ارسال شده باشد، گزارش شامل Sampling شده و ابتدا ده میلیون ایونت به‌عنوان نمونه انتخاب می‌شود و اطلاعات گزارش بر اساس این نمونه ساخته و نمایش داده می‌شوند.

 

نکته: اگر گزارشی که در Explore ساختید، کاملاً شبیه یک گزارش استاندارد باشد، دچار Sampling نخواهد شد و مشابه گزارش استاندارد عمل خواهد کرد.

نکته: فیلترها و سگمنت‌های اعمالی در گزارش نمی‌تواند با کاهش ایونت‌ها محدودیت Sampling را از بین ببرد. ملاک فقط تعداد کل ایونت ارسال‌شده در بازه زمانی گزارش است و اگر این مقدار بیشتر از ده میلیون باشد، Sampling رخ می‌دهد و سپس سگمنت‌ها و فیلترها روی دیتا نمونه‌گیری شده اعمال می‌شوند.

اکنون‌که با علت ایجاد Hit limit آشنا شدید، در قسمت آخر مقاله به روش‌های حل این مشکل Sampling اشاره می‌کنیم.

روش‌های حل مشکل Hit limit

چهار روش برای برخورد با Hit limit وجود دارد که اگر در یک گزارش اختصاصی بخش Explore با این محدودیت مواجه شدید، بتوانید با یکی از این روش‌ها مشکل گزارش را حل کنید.

روش اول: نادیده گرفتن محدودیت

اگر درصد کمی از اطلاعات گزارش شامل Sampling شده باشد، می‌توانید این محدودیت را نادیده بگیرید؛ چراکه تأثیر زیادی در تحلیل اطلاعات گزارش نخواهد داشت. با رفتن روی آیکون بالای گزارش می‌توانید ببینید چند درصد از اطلاعات در نمونه‌گیری انجام‌شده قابل‌مشاهده است و سپس تصمیم بگیرید که محدودیت را نادیده بگیرید یا خیر؟ حتی در درصدهای کمتر هم اگر به نحوه نمونه‌گیری GA4 اعتماد کنید، می‌توانید تحلیل را بر اساس مقادیر کمتر اطلاعات نیز انجام دهید.

روش دوم: کاهش بازه زمانی گزارش

 

همان‌طور که گفته شد زمانی Sampling رخ می‌دهد که در بازه زمانی گزارش بیشتر از ده میلیون ایونت جمع‌آوری‌شده باشد. پس می‌توانید با کاهش بازه زمانی، این مقدار را به کمتر از ده میلیون برسانید که دیگر گزارش شامل Sampling نشود. البته این روش به این شرط جوابگو خواهد بود که مشکلی با تغییر بازه زمانی گزارش نداشته باشید؛ در غیر این صورت اگر به هر دلیلی نمی‌توانید زمان گزارش را کم کنید، به سراغ روش‌های دیگر بروید.

روش سوم: تمیز کردن ایونت‌های ارسالی

یکی از اصلی‌ترین روش‌هایی که می‌تواند هم احتمال Sample شدن اطلاعات را کاهش دهد و هم نظم بهتری به آن‌ها بدهد، روش فیلتر کردن ایونت‌های جمع‌آوری‌شده است. نکته مهمی که در هنگام تنظیم و ارسال ایونت‌ها به GA4 باید به آن دقت کنید این است که فقط اقدام‌هایی از کاربر را ردیابی کنید که به آن‌ها نیاز دارید. ردیابی اقدام‌های بی‌اهمیت یا غیر مهم کاربر فقط باعث سخت کردن تحلیل اطلاعات و خراب شدن ساختار و نظم آن‌ها می‌شود. همچنین تعداد ایونت‌ها که افزایش یابد، باعث Data sampling نیز می‌شود.

پس اگر با این محدودیت روبرو هستید، یک‌بار تمامی ایونت‌هایی که به GA4 ارسال می‌کنید را بررسی کنید و ایونت‌های غیرضروری و با تعداد تکرار بالا را تا حد ممکن حذف کنید.

مثلاً یکی از ایونت‌هایی که می‌تواند تعداد کل ایونت‌های شما را به‌شدت زیاد کرده و اهمیت زیادی هم نداشته باشد، ایونت اسکرول است که میزان اسکرول کاربر در صفحات را اندازه‌گیری می‌کند. اگر برای صفحات زیادی درصدهای مختلفی از اسکرول را ردیابی کنید با مقدار زیادی ایونت مواجه می‌شوید که احتمال Data sampling را افزایش می‌دهد.

پس ایونت‌هایی مانند کلیک و اسکرول را فقط برای صفحات و موارد مهم ردیابی کنید. با این کار می‌توانید در ادامه حتی برای بازه‌های زمانی بزرگ‌تر نیز بدون Sampling گزارش‌ها را تحلیل کنید.

روش چهارم: استفاده از Big Query

اگر هیچ‌یک از روش‌های قبلی مناسب شما نبودند و با سایت پرترافیک و بزرگی روبرو هستید که مقدار ایونت‌های ضروری آن زیاد است، می‌توانید از روش آخر یعنی اتصال GA4 به Big Query استفاده کنید.

 

یکی از قابلیت‌های مهم GA4 که در نسخه قبلی وجود نداشت، اتصال رایگان پراپرتی نسخه جدید به ابزار Big Query است. با این کار تمامی اطلاعات جمع‌آوری‌شده در GA4 بدون Sampling و به‌صورت کامل در دیتابیس Big Query ثبت می‌شوند و شما می‌توانید با تسلط به این ابزار و دانش SQL گزارش‌های موردنیازتان را بسازید و دیگر محدودیت ده میلیون ایونت برای این ابزار وجود ندارد.

البته اتصال به GA4 رایگان است؛ اما اگر استفاده از اطلاعات و ساخت گزارش در ماه از یک حد معین بیشتر شود، مجبور به پرداخت هزینه و خرید اشتراک برای اعمال SQL های جدیدتر می‌شوید. برای سایت‌های بزرگ و پرترافیک که می‌توانند هزینه این ابزار را پرداخت کنند، امکانات بی‌شمار ابزار Big Query کاربردهای زیادی خواهد داشت و می‌تواند در ساخت گزارش‌های پیشرفته و ترکیب اطلاعات با منبع‌های دیگر کمک کند.

خلاصه و جمع‌بندی

در این مقاله با انواع محدودیت‌هایی که می‌تواند نمایش کل اطلاعات گزارش را در GA4 با مشکل روبرو کند، آشنا شدیم و بعد از بیان دلیل رخ دادن هر محدودیت، روش‌های حل این مشکلات را بررسی کردیم. به‌هرحال در کنار قابلیت‌های کاربردی و رایگانی که GA4 در اختیار ما قرار می‌دهد، کنار آمدن با این محدودیت‌هایی که یا تأثیر کمی در تحلیل ما داشته و یا روش‌هایی برای حل آن وجود دارد، منطقی و عاقلانه است. اگر در مورد این مقاله سؤالی برایتان پیش آمد، حتماً در قسمت نظرات آن را برای ما ارسال کنید.