لینک دانلود و خرید پایین توضیحات
دسته بندی : وورد
نوع فایل : word (..doc) ( قابل ویرایش و آماده پرینت )
تعداد صفحه : 33 صفحه
قسمتی از متن word (..doc) :
2
1
6 – 1 مقدمه
در بخش اول و در بحث برنامه ریزی بیان نمودیم که یکی از قسمتهای مهم در این فرایند تولید داده های مناسب می باشد. در حقیقت میزان درستی و درجهُ اطمینان هر نوع برنامه ریزی ارتباطات مستقیم، کیفیت و اعتبار داده های ورودی آن دارد.
در اکثر برنامه ریزی های منابع آب از داده های آماری گذشته استفاده می شود. میزان دقت ایستگاههای مختلف در اندازه گیری ها و پرت زمان نهدنه برداری از اینگونه شرایط از اهمیت زیادی برخوردار می باشد در بسیاری از اوقات نمی توان تنها به این داده ها اکتفا نمود بدلیل اینکه اولاً تاسسیات آبی غالباً در مدت زمان زیادی مورد بهره برداری قرار می گیرند و در این مدت هر گونه اتفاقاتی باید در نظر گرفته شود . ثانیاً این آمار متقلق به گذشته می باشد و نمی توان آنها را ملاک خوب برای کارهای برنامه ریزی در آینده در نظر گرفت.
در این میان روشهای آماری بکمک برنامه ریزان آمده است تا بتوانند از روی همین داده های موجود و اندازه گرفته شده به داده های مصنوعی بسازند تا جوابگوی این نیاز فرایند باشند.
با توجه به آنچه گفته شد مشاهده می گردد که این آمار مصنوعی چیز جدیدی نمی باشد و تنها با حفظ نمودن بعضی از خصوصیات آماری مربوط به داده های اندازه گرفته شده حاصل شده اند. این فزونی درست می باشد زیرا در اکثر پدیده های هیدرولوژیکی و وابسته به زمان میزان یک پارامتر ارتباط مستقیم با مقدار آن در دورهُ گذشته دارد و این وابستگی در دوره های زمانی نزدیک هم بیشتر است مثلاً جریان یک رودخانه در فروردین وابستگی زیادی به مقدار آن در اسفند دارد و این وابستگی در هفتهٌ آخر اسفند و هفته اول فروردین بمراتب بیشتر است.
6 – 2 – سری های زمانی
داده هایی را که از روی آنها داده های مصنوعی ساخته می شود سری های زمانی می نامیم {24}. سری های زمانی با توجه به پارامترهای فضای حالت هر یک می توان بصورت پیوسته و یا گسسته2 تعریف کردند. اگر متغیرهای سری بصورت تصادفی باشد به آنها فرایندهای اتفاقی اطلاق می گردد که این فرایند ها خود می توانند به هم وابسته و یا مستقل از هم باشند.{24}
همانطور که پیشتر توضیح دادیم، در علم هیدرولوژی اکثر سری مان زمانی بصورت اتفاقی می باشند. سری مان زمانی گاهی بواسطهُ ابعادشان نیز از هم نمیز داده می شوند، سری مان زمانی چند بعدی شامل اندازه گیری از چند متغیر می باشد {24}.
موضوع مهم دیگری که در ارتباط با سری مان زمانی مطرح می باشد ایستایی و نا ایستایی سری مان زمانی می باشد اگر عوامل طبیعی ها و یا غیر طبیعی ، سبب تغییرات عمده در روند وقوع متغییرها نباشد و تابع توزیع احتمال هر متغیر در هر زمان خاص از یک دوره ،ثابت باقی بماند سری را ایستا می گوییم و در غیر اینصورت نا ایستایی باشد {23}.
2
21
در این مبحث بدلیل اینکه موضوع اصلی این پایان نامه برنامه ریزی می باشد وارد ویژگی های مربوط به سری های زمانی نمی شویم و تنها راجع به نحوه ساختن داده های مصنوعی از روی این سری مان زمانی گفگو می نماییم . در ارتباط ، ویژگی های سری مان زمانی می توان به مراجع {25 } ، { 24 } ، { 9 } ، رجوع نمود.
6 – 3 – مدلهای اتفاقی تولید آمار مصنوعی
دو روش عمده جهت ساختن مدلهای مصنوعی از سری مان های زمانی موجود می باشد 1 – روش مستقیم1 2 – روش غیر تجمعی یا تجزیه2 . در این روش ما چیزی بیش از اطلاعات ارائه شده در سری مان زمانی ازائه نمی گردد و تنها با ثابت نگه داشتن یک یا چند ویژگی آماری از سری مان های زمانی، مدل مصنوعی ساخته می شود. این خواص می توانند میانگین ،انحراف معیار ،چولگی و ... باشد {24 }.
هیچ مدلی قادر نیست تا تمام این ویژگی ها را حفظ نماید و روشهای مختلف با توجه به خصوصیتی که حفظ نمایند از هم تمیز می شوند.
در روش مستقیم پارامترهای آماری مدل ، از ماهی به ماهی گویلر تغییر می کند و مستقیماً جریان مصنوعی ماهیانه تولید می شود. ولی در روش تجزیه یا غیر تجمل ابتدا راواناب سالانه تولید و سپس این مقادیر به جریان ماهیانه توزیع می گردد. { 23 }.
هر کدام از دو روش فوق روش های دیگری تجزیه می شوند که بعضی از آنها ارائه گردیده اند { 23 }
6 – 4 – معرفی نرم افزار hec – 4
در این رسانه برای ساختن داده های مصنوعی جهت برنامه ریزی پویا از نرم افزار hec – 4 استفاده گردیده است. این نرم افزار از روی مطالعات beard در سال 1962 و در مرکز مطالعات هیدرولوژی گروه مهندسین ارتش آمریکا (usa ce) در سال 1971 تدوین گردید. این برنامه با استفاده از مدل اتورگرسیو AR ( 1 ) و به صورت چند مکانی تهیه شده است و در آن سری جریاان های ماهیانه با استفاده از روش های، کرسیون به طور مستقیم در اتصاله قابل تولید می باشد .{ 24 }.
مدل AR ( 1 ) حالت ساده ای از مدل کلی ARMA ( P , Q } یا مدل باکس جین کنیز ( BOX JENKINS ) می باشد. این مدل دارای F عبارت اتورگرسیو و Q عبارت میانگین متحرک و بصورت کلی زیر می باشد. { 24 }
لینک دانلود و خرید پایین توضیحات
دسته بندی : وورد
نوع فایل : word (..doc) ( قابل ویرایش و آماده پرینت )
تعداد صفحه : 10 صفحه
قسمتی از متن word (..doc) :
1
a
گزارش کارآموزی
فهرست مطالب
عنوان صفحه
مشخصات دانشجو 3
مشخصات محل کارورزی و معرفی محیط کار 3
مدت زمان در کارگاه 5
میزان رضایت از دوره 5
مطالعات و تحقیقات جنبی 6
آموزش های فرا گرفته توسط دانشجو 7
2
مشخصات دانشجو
اینجانب مرضیه نوازی به شماره دانشجویی 8200114052 دانشجوی ترم آخر مقطع کاردانی رشته نرم افزار کامپیوتر هستم که دوره کارورزی خود را به مدت 240 ساعت در مجتمع تک واحد داده پردازی تون گذرانده ام.
مشخصات محل کارورزی و معرفی محیط کار :
شرکت داده پردازی تون (سهامی خاص) به شماره ثبت 16547 عضو شورای انفورماتیک مشهد فعالیت برنامه نویسی خود را از سال 1380 آغاز کرده و در این مدت توانسته سایتهای زیادی را طراحی و برنامه نویسی نماید. که بزرگترین پروژه شرکت در زمینه برنامه نویسی تجارت، طرح ملی اشتغال و کاریابی می باشد و مانند این پروژه شرکت در سطح کشور تا به حال انجام شده است.
شرکت داده پردازی تون واقع در مجتمع تک در طبقه هم کف می باشد که دارای دو بخش فروش و سخت افزاری است .
فعالیت های شرکت :
بخش فعالیت های برنامه نویسی و طراحی سایت
بخش فعالیت های پشتیبانی و شبکه
بخش فعالیت های آموزشی
بخش فعالیت های سخت افزاری فروش قطعات کامپیوتر و شبکه
بخش فعالیت پشتیبانی و شبکه
دسته بندی | کامپیوتر و IT |
بازدید ها | 34 |
فرمت فایل | doc |
حجم فایل | 249 کیلو بایت |
تعداد صفحات فایل | 31 |
در دو دهه قبل توانایی های فنی بشر در برای تولید و جمع آوری دادهها به سرعت افزایش یافته است. عواملی نظیر استفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسائل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستمهای سنجش از دور ماهواره ای، در این تغییرات نقش مهمی دارند[1].
بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات میکند. این رشد انفجاری در دادههای ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند: داده کاوی به عنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی داده کاوی فرآیندی است، خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند، که این دانش به صورت ضمنی در پایگاه داده های عظیم، انباره داده[1] و دیگر مخازن بزرگ اطلاعات، ذخیره شده است. داده کاوی بطور همزمان از چندین رشته علمی بهره می برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش[2]، حصول دانش[3]، بازیابی اطلاعات[4]،محاسبات سرعت بالا[5] و بازنمایی بصری داده[6] . داده کاوی در اواخر دهه 1980 پدیدار گشته، در دهه 1990 گامهای بلندی در این شاخه از علم برداشته شده و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد [2].
واژه های «داده کاوی» و «کشف دانش در پایگاه داده»[7] اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند. کشف دانش به عنوان یک فرآیند در شکل1-1 نشان داده شده است.
فهرست مطالب
1 مقدمه ای بر دادهکاوی... 3
1-1 چه چیزی سبب پیدایش داده کاوی شده است؟. 4
1-2 مراحل کشف دانش.... 6
1-3 جایگاه داده کاوی در میان علوم مختلف... 11
1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟. 12
1-5 داده کاوی و انبار داده ها 13
1-6 داده کاوی و OLAP. 14
1-7 کاربرد یادگیری ماشین و آمار در داده کاوی... 15
2- توصیف داده ها در داده کاوی... 15
2-1 خلاصه سازی و به تصویر در آوردن داده ها15
2-2 خوشه بندی 16
2-3 تحلیل لینک... 16
3- مدل های پیش بینی داده ها17
3-1 Classification. 17
3-2 Regression. 17
3-3 Time series. 18
4 مدل ها و الگوریتم های داده کاوی... 18
4-1 شبکه های عصبی 18
4-2 Decision trees. 22
4-3 Multivariate Adaptive Regression Splines(MARS). 24
4-4 Rule induction. 25
4-5 K-nearest neibour and memory-based reansoning(MBR). 26
4-6 رگرسیون منطقی... 27
4-7 تحلیل تفکیکی 27
4-8 مدل افزودنی کلی (GAM). 28
4-9 Boosting. 28
5 سلسله مراتب انتخابها29
منابع