داده های پرت و کناری
داده های پرت می توانند به علت های مختلفی حاصل شوند. به طور کلی این دلایل می توانند در دو گروه جای داده شوند. داده های پرتی که قانونی اند مثل زمانی که واقعا بعضی از آزمودنی ها استثنا می باشند و داده های پرتی که غیر قانونی اند مثل زمانی که داده های پرت عمدا توسط آزمودنی یا آزمونگر ایجاد شده اند. در هر صورت برای برخورد با داده های پرت شناخت آنها ضروری است.
برای شناسایی داده های پرت و انتهایی راههای متفاوتی وجود دارد. یک قانون سر انگشتی بیان می کند انحراف بیشتر از سه انحراف استاندارد را باید داده ی پرت در نظر گرفت که البته این موضوع برای داده های چوله نامناسب است. برای داده های دارای توزیع چوله نقاط برشی مطرح شده است. زمانی که توزیعات چند متغییری داریم شاخص هایی از فاصله مطرح می شوند مانند فاصله ی ماهالانوبیس و d کوکس. باقیمانده ی استاندارد شده و یا استیودنت شده مربوط به رگرسیون نیز می توانند در شناسایی مفید باشند.