مطالعات کوهورت شایع از بیماری های مزمن شامل غربالگری جمعیت ها و نمونه برداری افراد با شرایط مورد علاقه برای پیگیری آینده نگر است[1]. مثال هایی از این مطالعات عبارتند از آزمایشات غربالگری سرطان [2]، مطالعات شیوع اچ آی وی [3] و مطالعات زوال عقلی [4] [5]. طراحی کوهورت شایع هم کارآمد تر و هم عملی تر از طراحی کوهورت واقعه می باشد[6] که در آن گروهی از افراد عاری از بیماری برای شروع بیماری پیگیری می شوند، و تنها زیر مجموعه ای از افراد در حال توسعه بیماری، اطلاعاتی درباره زمان از شروع بیماری تا مرگ ارائه می دهند. طراحی کوهورت شایع ، یک شکل از نمونه برداری وابسته به پاسخ را برجسته می نماید، با این حال، به این معنا که افراد بیمار با زمان طولانی بقا ترجیحا برای ورود به کوهورت انتخاب می شوند[1] [2] [7]. برخی از نویسندگان به داده های نتیجه به عنوان «طول اریب » اشاره می کنند. استنباط آماری معتبر به طور مهمی به پرداختن کافی به طرح نمونه گیری در سازه احتمال ، و دو چارچوب گسترده برای تجزیه و تحلیل وابسته است ، که هر دو از زمان گزارش گذشته نگر از شروع بیماری ثبت شده در زمان نمونه برداری استفاده می کنند.
تجزیه و تحلیل در چارچوب مشروط مبتنی بر این واقعیت است که افرادی که قبل از زمان غربالگری درگذشته اند (فوت کرده اند) نمی توانند نمونه باشند و بنابراین زمان های بقا در افراد نمونه بوسیله زمان شروع بیماری برای ثبت به چپ کوتاه شده است (توزیع ناقص به چپ). چارچوب غیرشرطی مبتنی بر چگالی زمان های بقا مشتق شده تحت طرح نمونه گیری کوهورت شایع است.
یعنی، اگر بروز بیماری ثابت باشد، زمان های شروع از یک فرایند پواسون همگن زمان تبعیت می کنند، و زمان های کوتاه سازی به چپ ، یک چگالی ثابت است. اگر احتمال این که یک فرد نمونه شود، متناسب با زمان بقای آنها است، چگالی زمان مرتبط با این طرح نمونه برداری را می توان به دست آورد و برای ساخت احتمال مورد استفاده قرار داد.
برای رویکرد شرطی، روش های پارامتری، غیر پارامتری و نیمه پارامتری نسبتا ساده و سر راست هستند و کاربرد قابل توجهی دیده اند [3] [8] [11]. وانگ [10] یک برآورد کننده محصول مشخص برای زمان های بقا کوتاه سازی شده به چپ ارائه کرده است که احتمال مشروط را حداکثر می سازد و زمانی که توزیع متغیر زمان کوتاه سازی نامشخص است هیچ اطلاعاتی را از دست نمی دهد. برای مدل های نیمه پارامتری کاکس، روش احتمال جزئی را می توان برای داده های به چپ کوتاه شده اما با یک تنظیم ریسک سازگار اتخاذ کرد [8] [11] [12]. وانگ و همکاران [12] استدلال کردند که تخمین کننده های غیر پارامتری و نیمه پارامتری کارآمد می باشد زمانی که توزیع زمان کوتاه سازی نامشخص است اما می تواند ناکارآمد باشد زمانی که توزیع زمان کوتاه سازی پارامتری سازی شده است.
تجزیه و تحلیل غیرشرطی [5] [13] – [16] مبتنی بر توزیع مشترک از زمان عود به عقب (وارون) (زمان از شروع بیماری برای روش نمونه گیری) و زمان عود به جلو (زمان از نمونه گیری تا مرگ) است. واردی [14] [13] و اصغریان و همکاران [5] برآورد کننده حداکثر احتمال ناپارامتری (NPMLE) را برای زمان های بقا طول اریب از راست کوتاه سازی شده را توسعه دادند ، اما این NPMLE فرم بسته ای نداشته و توزیع محدود آن مقاوم است [15] [16].
هوانگ و شین [17] یک فرم بسته برآورد کننده ناپارامتری جدید ارائه کردند که اطلاعات در مورد نمونه گیری طول اریب را با هم ترکیب می کند. وانگ [18] یک شبه احتمال برای زمان های شکست طول اریب تحت مدل مخاطرات متناسب کاکس پیشنهاد کرد ، اما این روش را نمی توان برای زمان های شکست راست سانسور شده (ناقص از راست) اعمال کرد. لو و تیسای [19] و تیسای [20] برآوردگرهای شبه جزئی-احتمال برای داده های با طول اریب راست سانسور شده ارائه کردند که فرم بسته دارد و راندمان بالا را حفظ می کند. شن و همکاران [21] اثرات همگام مدلسازی را برای داده های طول اریب تحت مدل های زمان شکست شتاب دار و تبدیل زمان در نظر گرفتند. شین و شن [22] اخیرا دو معادله برآورد برای تناسب مدل مخاطرات متناسب کاکس ارائه کرده اند که بر اساس مجموعه های مختلف ریسک وزنی فرموله می گردد.
هر دوی تجزیه و تحلیل مشروط و غیرشرطی از صورت گذشته نگر برای گزارش زمان های شروع بیماری استفاده می کنند ، که تجزیه و تحلیل غیرشرطی بیشتر بر اساس فرض فرایند بروز (پواسون) ثابت می باشد. با این حال، اغلب خطای قابل توجه و عدم قطعیت در زمانهای شروع گزارش شده به صورت گذشته نگر وجود دارد. این امر به ویژه برای زمانهای شروع مربوط به بیماری های اختلال شناختی و یا اختلالات سلامت روانی است. در برخی از تنظیمات، زمان های گزارش بهتر ممکن است نشان دهنده زمان شروع علائم، به جای شروع واقعی روند بیماری باشد که می تواند منجر به کم بها دادن (تخمین کمتر از حد) طول مدت بیماری شود. در تنظیمات دیگر خطاها ممکن است منجر به زمان های شروع گزارش شده زودتر یا دیرتر شود.
هدف از این مقاله بررسی تاثیر خطای اندازه گیری در زمان شروع گزارش شده به صورت گذشته نگر برای هر دو چارچوب مشروط و غیرشرطی می باشد. ادامه مقاله به شرح زیر است. در بخش 2، ما نمادها و ساخت احتمال را برای اطلاعات کوهورت شایع معرفی می کنیم. تاثیر بد مشخص کردن زمان شروع بیماری در بخش 3 توسط شبیه سازی برای روش های غیرشرطی و مشروط بررسی شده است و روش های اصلاح این خطای اندازه گیری در بخش 4 توصیف شده است. ملاحظات عمومی و موضوعاتی برای تحقیق بیشتر در بخش 5 داده شده است.