مقدمه
در دنیای بیومکانیک و علوم اعصاب، تحلیل دادههای پیوسته مانند سیگنالهای الکترومیوگرافی (EMG)، الکتروانسفالوگرافی (EEG) و دادههای کینماتیک و کینتیک، نقش حیاتی در درک عملکرد بدن انسان ایفا میکند. این دادهها اغلب به صورت سریهای زمانی پیوسته ثبت میشوند و حاوی اطلاعات غنی در مورد الگوهای حرکتی، فعالیت عضلانی و مغزی هستند. اهمیت تحلیل این دادهها در تشخیص اختلالات حرکتی، ارزیابی عملکرد ورزشی، و طراحی برنامههای توانبخشی نهفته است. برای مثال، در بیومکانیک، تحلیل نیروی عکسالعمل زمین (GRF) طی گامبرداری میتواند به شناسایی ناهنجاریهای گام کمک کند، در حالی که EMG فعالیت عضلات را در حین حرکات پیچیده مانند اسکوات یا دوچرخهسواری نشان میدهد. EEG نیز برای بررسی فعالیتهای مغزی در پاسخ به محرکهای حسی-حرکتی استفاده میشود، که در مطالعات نوروساینس و توانبخشی کاربرد دارد.
با این حال، روشهای سنتی آماری مانند t-test یا ANOVA نقطهای، محدودیتهای جدی دارند. این روشها معمولاً بر روی نقاط گسسته یا میانگینهای زمانی تمرکز میکنند، که منجر به از دست رفتن اطلاعات زمانی پیوسته میشود. برای نمونه، در تحلیل EMG، اگر تنها حداکثر فعالیت عضله را بررسی کنیم، الگوهای زمانی تغییرات را نادیده میگیریم، که میتواند به خطاهای نوع اول (false positive) یا نوع دوم (false negative) منجر شود. علاوه بر این، در دادههای پیوسته، همبستگیهای فضایی-زمانی وجود دارد که روشهای کلاسیک نمیتوانند به درستی کنترل کنند، منجر به نتایج غیرقابل اعتماد در مطالعات بیومکانیکی میشود. این محدودیتها به ویژه در مقایسه گروههای مختلف (مانند بیماران و افراد سالم) یا شرایط آزمایشی (مانند قبل و بعد از تمرین) برجسته است.
Statistical Parametric Mapping (SPM) به عنوان یک رویکرد نوین، این مشکلات را حل میکند. SPM، که ابتدا برای تصویربرداری عصبی توسعه یافت، اکنون در بیومکانیک برای تحلیل دادههای یکبعدی (1D) پیوسته مانند سریهای زمانی استفاده میشود. فلسفه SPM بر پایه تئوری میدانهای تصادفی (Random Field Theory – RFT) استوار است، که اجازه میدهد آزمونهای آماری بر روی کل میدان داده (مانند یک منحنی کامل EMG) انجام شود، بدون نیاز به استخراج نقاط گسسته. این روش با محاسبه آمارهای پارامتریک در هر نقطه از میدان و کنترل خطای خانوادگی (family-wise error rate) از طریق RFT، نتایج معتبرتری ارائه میدهد.
در بیومکانیک، SPM برای تحلیل EMG در گامبرداری، EEG در فعالیتهای شناختی، و GRF در پرشها کاربرد دارد. بسته spm1d در Python/MATLAB این ابزار را در دسترس قرار داده و امکان تحلیلهای پیشرفته را فراهم میکند. این رویکرد نه تنها دقت را افزایش میدهد، بلکه به پژوهشگران اجازه میدهد الگوهای پنهان در دادههای پیوسته را کشف کنند، که در روشهای سنتی ممکن نیست.
در این مقاله، اصول SPM، انواع آزمونها، آمادهسازی دادهها، تحلیل عملی با Python، کاربردها، مزایا و محدودیتها بررسی میشود، با تمرکز بر دادههای EMG، EEG و بیومکانیکی.
اصول آماری و تئوری
SPM بر پایه مفهوم “Statistical Field” عمل میکند، که یک میدان پیوسته از مقادیر آماری (مانند t یا F) است که بر روی دادههای ثبتشده (مانند سری زمانی EMG) محاسبه میشود. در بیومکانیک، دادههای 1D مانند منحنی نیروی GRF یا سیگنال EEG به عنوان میدانهای تصادفی در نظر گرفته میشوند، جایی که هر نقطه زمانی یک متغیر وابسته است.
تئوری میدانهای تصادفی (RFT) هسته SPM است. RFT برای کنترل خطای نوع اول (alpha) در آزمونهای چندگانه استفاده میشود. در دادههای پیوسته، تعداد آزمونهای مستقل بینهایت است، بنابراین Bonferroni ساده بیش از حد محافظهکارانه است. RFT با تخمین “صافی” (smoothness) میدان از طریق FWHM (Full Width at Half Maximum) و محاسبه احتمال تجمعهای (clusters) تصادفی، آستانههای بحرانی را تعیین میکند. برای مثال، در تحلیل EMG، اگر یک خوشه از مقادیر t بالای آستانه باشد، آن خوشه به عنوان تفاوت معنادار شناسایی میشود، با کنترل family-wise error rate (FWER).
انواع آزمونهای SPM با مثالهای کاربردی
SPM انواع آزمونهای آماری را برای دادههای یکبعدی (1D) پشتیبانی میکند و امکان تحلیل میدانهای پیوسته را فراهم میآورد. این آزمونها به پژوهشگران اجازه میدهند که تغییرات زمانی یا مکانی سیگنالها را به صورت دقیق و پیوسته بررسی کنند، بدون آنکه اطلاعات محلی از دست برود.
t-test یک نمونهای: این آزمون برای مقایسه یک گروه با مقدار ثابت یا مرجع استفاده میشود. به عنوان مثال، در تحلیل EEG در حالت استراحت، میتوان بررسی کرد که آیا فعالیت دلتا در طول زمان بیشتر از سطح پایه است یا خیر. این روش به ویژه برای تحلیل تغییرات در طول یک بازه زمانی یا فاز مشخص مفید است.
t-test دو نمونهای: این آزمون برای مقایسه دو گروه مستقل استفاده میشود. برای مثال، میتوان فعالیت EMG عضله تیبیالیس آنتریور را بین افراد سالم و بیماران مبتلا به نوروپاتی مقایسه کرد. تحلیل دادهها نشان میدهد که تفاوت در دامنه فعالیت عضله ممکن است در طول چرخه گامبرداری رخ دهد و خوشههای زمانی مشخصی تفاوتها را نشان دهند.
t-test زوجی: این آزمون برای دادههای وابسته و تکراری استفاده میشود، مانند مقایسه EMG یک عضله قبل و بعد از یک دوره تمرینی در همان افراد. این روش اجازه میدهد تغییرات فردی در پاسخ به مداخله یا تمرین به صورت دقیق شناسایی شود.
ANOVA یکراهه: این آزمون برای مقایسه چند گروه استفاده میشود. به عنوان مثال، تحلیل نیروهای واکنشی زمین (GRF) در سه سطح سرعت گامبرداری میتواند تفاوتهای زمانی و مکانی بین گروهها را نشان دهد و خوشههایی از نقاط بحرانی را شناسایی کند که در روشهای سنتی ممکن است از دست بروند.
ANOVA دوراهه: این آزمون برای تحلیل اثر دو عامل و تعامل آنها استفاده میشود. برای مثال، در تحلیل EEG میتوان اثر عامل “محرک” و “گروه سنی” را همزمان بررسی کرد و خوشههایی از زمان یا مکان که اثر تعامل بین عوامل قوی است را شناسایی نمود.
رگرسیون خطی: این آزمون برای بررسی رابطه بین یک متغیر وابسته و یک یا چند متغیر مستقل به کار میرود. به عنوان مثال، میتوان رابطه بین فعالیت EMG و سن در بیماران را تحلیل کرد تا اثر سن بر الگوهای عضلانی شناسایی شود.
MANOVA: این آزمون برای دادههای چندمتغیره استفاده میشود، یعنی زمانی که چندین متغیر وابسته همزمان بررسی میشوند. برای مثال، میتوان EMG و EEG را همزمان تحلیل کرد تا تغییرات همزمان سیستمهای عصبی-عضلانی شناسایی شود.
مثال فرضی: در مطالعات شبیهسازی، میتوان دو گروه با دادههای تولیدشده به صورت تصادفی یا سینوسی شبیهسازی کرد تا تفاوتها در خوشههای زمانی مشخص شناسایی شود. این مثالها کمک میکنند تا مفهوم خوشههای SPM و شناسایی تفاوتهای زمانی برای دانشجویان و محققان روشن شود.
مثال واقعی: در دادههای EMG موجود در مجموعه PhysioNet، مقایسه بین افراد سالم و بیماران مبتلا به نوروپاتی نشان میدهد که خوشههای تفاوت در فازهای مختلف چرخه گام به وضوح قابل شناسایی هستند. این یافتهها نشان میدهد که تحلیلهای نقطهای ساده ممکن است تفاوتهای مهم را از دست دهند، اما SPM الگوهای پیوسته و معنادار را آشکار میکند.
آمادهسازی دادهها و نرمالسازی
نرمالسازی زمانی (time-normalization) ضروری است تا دادهها به طول یکسان (مانند ۱۰۱ نقطه برای ۰-۱۰۰%) تبدیل شوند. در Python: استفاده از scipy.interpolate برای resampling.
Smoothing و فیلتر: برای کاهش نویز، از فیلتر Butterworth یا Gaussian. در EMG، فیلتر low-pass ۲۰Hz. کد: from scipy.signal import butter, filtfilt.
آمادهسازی داده واقعی: دانلود از PhysioNet، load با wfdb، نرمالسازی، smoothing.
شبیهسازی: Y = np.random.normal(0, 1, (10, 101)) + np.sin(np.linspace(0, 2*np.pi, 101)).
تحلیل عملی با Python
ابتدا، نصب spm1d (فرض کنید موجود). مثال شبیهسازی t-test دو نمونهای:
import numpy as np import spm1d # شبیهسازی داده EMG np.random.seed(0) YA = np.random.normal(0, 1, (15, 101)) # گروه A YB = np.random.normal(0.5, 1, (15, 101)) + np.sin(np.linspace(0, 2*np.pi, 101)) * 0.5 # گروه B # t-test دو نمونهای t = spm1d.stats.ttest2(YA, YB) ti = t.inference(0.05, two_tailed=True) ti.plot() # تفسیر: خوشههای بالای آستانه نشاندهنده تفاوت معنادار.
برای ANOVA یکراهه:
Y1 = np.random.normal(0, 1, (10, 101)) Y2 = np.random.normal(1, 1, (10, 101)) Y3 = np.random.normal(2, 1, (10, 101)) F = spm1d.stats.anova1((Y1, Y2, Y3)) Fi = F.inference(0.05) Fi.plot()
مثال واقعی با dataset PhysioNet EMG:
دانلود emg_healthy.dat و emg_neuropathy.dat.
import wfdb
from scipy.interpolate import interp1d
from scipy.signal import butter, filtfilt
# Load data
rec_healthy = wfdb.rdrecord('emg_healthy')
sig_healthy = rec_healthy.p_signal[:,0]
# فیلتر Butterworth
b, a = butter(4, 20/(4000/2), 'low')
sig_filt = filtfilt(b, a, sig_healthy)
# نرمالسازی زمانی به 101 نقطه
t_orig = np.linspace(0, 1, len(sig_filt))
interp_func = interp1d(t_orig, sig_filt)
t_norm = np.linspace(0, 1, 101)
sig_norm = interp_func(t_norm)
# مشابه برای چند مشاهده، سپس SPM t-test
مثال عددی مرحله به مرحله: فرض دو مشاهده ساده، محاسبه t در هر نقطه، سپس RFT.
تحلیل خروجی: نمودار t با آستانه، خوشهها نشاندهنده مناطق تفاوت.
کاربردهای SPM در پژوهش و توانبخشی
در تحلیل اسکوات: SPM تفاوت EMG عضلات را در فازهای مختلف نشان میدهد.
دوچرخهسواری: تحلیل GRF و EMG برای بهینهسازی.
پرش و گام: شناسایی ناهنجاریها در EEG و EMG.
در EEG: تشخیص فعالیت مغزی در توانبخشی سکته.
در بازتوانی: طراحی تمرینات اصلاحی بر اساس خوشههای تفاوت.
مزایا و محدودیتها
مزایا: تحلیل کامل سری زمانی بدون abstraction، کنترل خطا با RFT، یکپارچگی برای انواع آزمونها.
محدودیتها: حساس به صافی ناهمگن، عدم تصحیح اسفریسیتی در برخی طراحیها، بایاس در نمونههای کوچک.
منابع
Pataky, T.C. (2012). One-dimensional statistical parametric mapping in Python. Computer Methods in Biomechanics and Biomedical Engineering.
Serrien, B., et al. (2019). Statistical parametric mapping of biomechanical one-dimensional data. International Biomechanics.
لینکها: https://spm1d.org/ برای کد و مستندات.
Datasetها: PhysioNet EMG: https://physionet.org/content/emgdb/1.0.0/ EEG: OpenNeuro datasets.