ML ( زبان افزایش نرخ توسعه پذیر) بیشتر به عنوان فرمت تبادل قابل مصرف انسانی به کار می رفت.با این حال میزان دیتای XML تبادل یافته اغلب به طور نمایی از طریق رسانه ی وب رشد می یابد.برنامه ی وب همانند موتور جستجو،تجارت الکترونیک، پرتال های یادگیری الکترونیک به ابزارهای پیشرفته برای مدیریت دیتا نیاز دارند. جوامع از موتور جستجو فقط برای بازیابی پرس و جو های با متن کامل استفاده نمی کنند بلکه برای داده های ویژه هایی درخواست دارند (پرس و جو های ساختاری). این شرایط را برای ذخیره سازی و پرس و جو کردن داده های XML مقیاس کلان به صورت تا حد امکان کارآمد و قابل اعتماد هدایت می نماید.چندین زبان پرس و جو ارائه شده اند مانند Lorel [1], Quilt [2],XML-GL [3], XPath [4], XQuery [5], XOM [6], XAL [7] andYATL [8]. این زبان های پرس و جو از عبارت مسیر عادی (مقرر) استفاده می کنند، بنابراین از دستاورد مرسوم استفاده می کنند هماندن پیمایش درختی که ممکن است دارای دارای تنزل عملکرد به ویژه بر روی دسترسی همزمان باشد.
این مقاله بیشتر به سه بخش تقسیم می شود: مدل دیتای XML، ذخیره سازی XML ،تکنیک های اندیس کننده و لیبل گذاری. بخش 2 ساختار XML و مدل دیتا را ارائه می نماید. بخش 3 گزینه های ممکن را برای ذخیره ی XML توصیف می نماید.یک دیتای نیمه ساخت یافته بودن، سه راه دارد. بخش 4 تکنیک های بهینه سازی را از طریق طرح اندیس کننده و لیبل گذاری به ترتیب ارائه می دهد. بخش 5 نتیجه گیری می کند و تکنیک های بهینه سازی پیوندی را از طریق مقایسه ی مزایا و معایب این تکنیک ها ارائه می دهد. با این حال اسناد ریاضی و نظری در این مقاله حذف می شوند.