پرش به محتویات

درسنامه ۲-۶: مرتب‌سازی و شمارش با sort و wc

این دو ابزار برای مرتب‌سازی و گرفتن آمار خطوط/کلمات کاربرد دارند.

sort — مرتب‌سازی

sort names.txt             # مرتب‌سازی الفبایی
sort -n scores.txt         # مرتب‌سازی عددی
sort -u words.txt          # حذف تکراری‌ها هنگام مرتب‌سازی

wc — شمارنده

wc -l file.txt             # تعداد خطوط
wc -w file.txt             # تعداد کلمات
wc -c file.txt             # تعداد بایت‌ها

الگوی پرتکرار: شمارش فراوانی

sort words.txt | uniq -c | sort -nr | head

تمرین کوتاه

  • لیست نمره‌ها را عددی مرتب کنید و بیشترین‌ها را ببینید.
  • فراوانی واژه‌ها را در یک متن کوتاه محاسبه کنید.

نکات و مثال‌های بیشتر

  • مرتب‌سازی بر اساس ستون خاص (با جداکنندهٔ کاما):
sort -t, -k3,3n scores.csv   # ستون سوم، عددی
  • حذف تکراری‌ها پس از مرتب‌سازی و شمارش:
sort names.txt | uniq -c | sort -nr
  • شمارش خطوط چند فایل باهم و جمع کل:
wc -l *.txt

خطاهای رایج

  • فراموش کردن -n برای مرتب‌سازی عددی.
  • عدم تعیین جداکنندهٔ درست با -t هنگام کار با CSV/TSV.