مقدمه
در درس قبل دیدیم که برای تعریف متغیرهای پایتون، نیاز به اعلان نوع نیست و یک متغیر پایتون به سادهترین شکل
ممکن و با گزارهای مثل x = value ایجاد میشود. اما هر مقدار مثل value متعلق به یک نوع (type) یا به بیان
دقیقتر یک نوع داده (datatype) است و از طرفی، ماهیت دینامیک سیستم نوع (type system) در پایتون باعث میشود که
متغیرها بتوانند در طول برنامه، مقادیری از نوعهای مختلف دریافت کنند. بنابراین، هر متغیر پایتون، در هر لحظه،
میتواند از یک نوع باشد و این نوع معمولاً از آخرین مقدار تخصیص داده شده به آن متغیر، مشخص میشود. در پایتون،
چند نوع درونی (built-in) وجود دارد که برای کار با مقادیر رایجی مثل اعداد، رشتههای متنی و کالکشنها تدارک
دیده شدهاند. در این درس، این نوعهای built-in را به طور گذرا معرفی میکنیم و در درسهای بعدی این فصل و سه
فصل بعد، این نوعها را با جزئیات بیشتر مورد بررسی قرار میدهیم.
نوعهای Built-in
نوعهای built-in در پایتون را میتوانیم در دو گروه قرار دهیم: نوعهای سادهای که مقادیر آنها فقط شامل یک چیز
(یک عدد، یک رشته و ...) هستند و نوعهای پیچیدهتری که مقادیر آنها میتوانند شامل یک کالکشن یا دنباله از
مقادیرِ نوعهای مختلف باشند.
نوع |
مقادیر |
مثال |
int |
اعداد صحیح |
a = 8
b = 1_000_000
|
float |
اعداد اعشاری |
x = 1.0
y = 1.25
|
complex |
اعداد مختلط |
z = 3 + 5j
w = 2 - 4j
|
str |
رشتههای کاراکتری |
s1 = "Hi"
s2 = 'Hello'
|
bool |
مقادیر بولین |
b = False |
list |
یک کالکشن تغییرپذیر از مقادیر ترتیبی |
l1 = [1, 2, 3, 4]
l2 = [1, "one", 1.0]
|
tuple |
یک کالکشن تغییرناپذیر از مقادیر ترتیبی |
t1 = (1, 2, 3, 4)
t2 = (1, "one", 1.0)
|
range |
یک کالکشن تغییرناپذیر به صورت یک بازه از مقادیر |
r1 = range(2, 6)
r2 = range(1, 10, 2)
|
dict |
یک کالکشن تغییرپذیر از جفتهای key و value |
d = {'name': 'lale', age: 4}
|
set |
یک کالکشن تغییرپذیر از مقادیر غیرترتیبی |
s = {2, 4, 6, 8}
|
frozenset |
یک کالکشن تغییرناپذیر از مقادیر غیرترتیبی |
f1 = frozenset([1, 2, 3])
f2 = frozenset({1, 2, 3})
|
NoneType |
مقدار None |
x = None
|
در جدول بالا ۵ نوع اول، نوعهای ساده هستند. یعنی مقادیر این نوعها فقط میتوانند شامل یک چیز باشند؛ مثلاً یک
عدد صحیح، یک رشتهی متنی و غیره. اما شش نوع بعدی، نوعهایی هستند که مقادیر آنها میتوانند یک کالکشن از
مقادیر را نگه دارند. همانطور که میبینید، چیزی که بین این کالکشنها تفاوت ایجاد میکند، دو مفهوم تغییرپذیری
و ترتیب است. در ادامه، این مفاهیم را در عمل خواهیم دید. نوع آخر یعنی NoneType هم یک نوع
خاص است که فقط شامل
یک مقدار None است که مفهومی معادل تهی (empty) دارد.
در اینجا یک معرفی مختصر از هر یک از این نوعها خواهیم داشت و در آینده با جزئیات مربوط به آنها آشنا میشویم.
البته بحث ما در مورد نوعهای عددی int و float کمی مفصلتر خواهد بود
اما جزئیات بیشتری از این نوعها هم در
درس کار با اعداد ارائه خواهد شد.
نوع int در پایتون
معرفی نوعهای built-in پایتون را با نوع int شروع میکنیم که همانطور که در جدول بالا هم
اشاره شده، شامل
مقادیر عددی صحیح است. یعنی در پایتون، هر عدد صحیح از نوع int در نظر گرفته میشود. بازهی
مقادیر برای نوع int
بازهی (-inf, inf) است. یعنی هر عدد صحیح، هرچقدر هم که بزرگ باشد، حتی اگر
هزاران رقم داشته باشد، به نوع int
متعلق است. بنابراین، اعمال محاسباتی روی اعداد صحیح خیلی بزرگ هم به صورت دقیق و بدون مسائلی مثل خطای دقت و
سرریز (overflow) انجام میشود.
مفسر پایتون را در ترمینال فراخوانی کنید و کد زیر را در آن آزمایش کنید. تأکید میکنم که هر خطی که با
کاراکترهای >>> شروع شده، توسط ما وارد میشود و سایر خطوط، نتیجهی
اجرای کدها هستند.
>>> a = 8
>>> a + 1
9
>>> b = 10 ** 80
>>> b + 1
100000000000000000000000000000000000000000000000000000000000000000000000000000001
در پایتون نماد ** متعلق به عمل محاسباتی توان است و عبارتی مثل a ** b به معنای ab
است. در مورد
عملگرهای حسابی در درسهای بغد، مطالب لازم بیان خواهد شد.
انعطافپذیری نوع int
در طراحی و توسعهی زبان پایتون، اصل بر سادگی، انعطافپذیری و ارگونومی بالا بوده و هست. بنابراین، در
تعارضات اجتنابناپذیری که در طراحی زبان وجود دارد، اولویت به ارگونومی و سادگی داده شده است. در اکثر
زبانهای برنامهنویسی، نوع یا نوعهایی که برای کار با اعداد صحیح در نظر گرفته شدهاند، شامل یک بازهی مشحص
و محدود از اعداد صحیح هستند. بنابراین، برنامهنویس باید مراقب رخ دادن خطاهای دقت و سرریز از بازهی مقادیر
مجاز (overflow) برای هر نوع باشد و بداند که رفتار آن زبان در هنگام رخ دادن سرریز چیست. اما در پایتون، ما
با چنین مسائلی مواجه نخواهیم شد؛ چون فقط یک نوع int برای اعداد صحیح وجود دارد که هیچ
محدودیتی از نظر
بازهی مقادیر ندارد. در پایتون، سایز نوع int متغیر است. به این ترتیب، اعداد صحیح
کوچکتر فضای کمتری
میگیرند و اعداد بزرگتر به صورت دینامیک فضای بیشتری دریافت میکنند. این پیادهسازی، هزینههای مربوط به
کارایی (performance) را که قاعدتاً باید به خاطر نامحدود بودن بازهی مقادیر int تحمیل
شود، به حداقل
میرساند.
نمایش اعداد صحیح در سایر مبناها
امکان نمایش اعداد صحیح در مبناهای به جز 10 هم وجود دارد. اعداد باینری، یعنی اعداد در مبنای 2 که فقط از دو
رقم صفر و 1 تشکیل میشوند، با پیشوند 0b، اعداد اکتال، یعنی اعداد در مبنای 8 که از هشت رقم 0 تا 7 تشکیل
میشوند، با پیشوند 0o و اعداد هگزادسیمال، یعنی اعداد در مبنای 16 که از شانزده رقم شامل ارقام صفر تا 9 و
کاراکترهای a تا f (به جای 10 تا 15) تشکیل میشوند، با پیشوند 0x قابل ایجاد هستند.
>>> 0b11111111
255
>>> 0xff
255
نوع float در پایتون
در پایتون، نوع float برای نمایش اعداد اعشاری در نظر گرفته شده است. این نوع در زبانهای
دیگر با نامهایی مثل
double یا f64 شناخته میشود و از روی استانداردی به نام IEEE-754 پیادهسازی شده است. بر خلاف نوع int، نوع
float سایز ثابتی معادل 64 بیت دارد و امکان تغییر سایز آن به صورت دینامیک، وجود ندارد.
بنابراین، نوع float
بازهی مشخصی از مقادیر را شامل است. تعیین دقیق بازهی مقادیر ممکن برای نوع float به
پلتفرم بستگی دارد اما در
اکثر سیستمها:
-
مقدار ماکزیمم یا بزرگترین عدد مثبتی که به نوع float متعلق است، تقریباً برابر با 1.79×10308 است. هر
عدد اعشاری بزرگتر از این عدد، برابر با بینهایت (inf) در نظر گرفته میشود.
-
مقدار مینیمم یا کوچکترین عدد مثبتی که به نوع float متعلق است، تقریباً برابر با 2.2×10-308 است. هر
عدد مثبت کوچکتر از این عدد، برابر با 0.0 در نظر گرفته میشود.
اعداد اعشاری را میتوان با استفاده از نماد علمی هم نمایش داد. در این روش، از کاراکتر e یا E برای توانرسانی
استفاده میشود؛ به این شکل که عدد aeb یا aEb برابر با a×10b محسوب میشود. حالا
مثال زیر را ببینید.
>>> 1e308
1e308
>>> 1e309
inf
>>> -1e309
-inf
پس، نوع float در پایتون شامل بازهای از اعداد اعشاری به همراه دو مقدار inf و -inf و البته یک مقدار خاص دیگر
به نام nan است. اجازه دهید ببینیم این مقادیر عددی خاص در پایتون چه رفتاری دارند.
مقادیر inf و nan
دیدیم که اعدادی که از مقدار ماکزیمم بازهی مقادیر float بزرگتر باشند، برابر با مقدار
خاص inf در نظر گرفته
میشوند که همان مفهومی است که آن را با نام بینهایت میشناسیم. مقدار nan نیز بهنوعی، نشانگر مفهوم
مبهم در
حسابان (calculus) است. اما این مفاهیم در برنامهنویسی به همان شکلی که در ریاضیات دیدهایم، کار نمیکنند و با
وجود شباهتها، تفاوتهایی وجود دارد که باید از آن مطلع باشیم. گذشته از این، حتی زبانهای برنامهنویسی هم این
مفاهیم را به شکل یکسان پیادهسازی نکردهاند و بنابراین، اگر با زبانهای دیگر آشنا هستید، نباید فکر کنید که
رفتار این مقادیر در پایتون مشابه زبانهای دیگر است. بعد از این روشنگری، اجازه دهید بپردازیم به مقادیر
inf و
nan در دنیای پایتون.
اما راستش را بخواهید، روشنگری ما هنوز به پایان نرسیده و یک نکتهی دیگر از آن باقی مانده. حتی در دنیای پایتون
هم همه چیز یکسان و یکنواخت نیست. در پایتون استاندارد، عبارت 1.0 / 0.0 و به طور
کلی حاصل تقسیم هر مقدار عددی
بر صفر منجر به خطا میشود اما در کتابخانهای مثل NumPy حاصل این تقسیم برابر با inf است. به هر حال،
فعلاً
موضوع بحث ما، پایتون استاندارد است.
مقدار nan از عبارت not a number گرفته شده و در اثر یک عمل محاسیاتی نامعتبر تولید میشود. در مورد
رفتار
مقادیر عددی inf و nan در پایتون، باید به نکات زیر توجه داشته باشید.
-
تقسیم هر مقدار عددی (از جمله inf و nan) بر صفر باعث تولید خطا میشود.
-
حاصل عبارات inf - inf و inf / inf برابر با
nan خواهد بود.
-
حاصل هر مقدار عددی به توان صفر برابر با 1 خواهد بود.
حالا به مثال زیر توجه کنید.
>>> x = 1e500
>>> y = 1e400
>>> x
inf
>>> y
inf
>>> x - y
nan
>>> x / y
nan
>>> x + y
inf
>>> x * y
inf
>>> x ** y
inf
>>> x ** 0
1.0
>>> 0 ** 0
1.0
خطاهای مربوط به اعداد اعشاری
دیدیم که پایتون با اعداد خارج از بازهی مقادیر float چه رفتاری دارد. اما نمایش اعداد
درون بازهی مقادیر
float هم میتواند با خطاهایی مثل خطای تقریب همراه باشد و این موضوعی است که باید از کم و
کیف آن باخبر باشیم
تا با نتایح غیر قابل انتظار مواجه نشویم.
اعداد اعشاری در کامپیوتر به فرمت باینری نمایش داده میشوند و در این فرمت، امکان نمایش دقیق خیلی از اعداد
اعشاری (حتی اعدای به سادگی 0.1 و 0.2) وجود ندارد و در عمل، تقریبی از این اعداد ذخیره میشود. وقتی پای تقریب
در میان باشد، مقداری خطا هم وجود خواهد داشت که ناشی از اختلاف مقدار تقریبی و مقدار واقعی است.
>>> 0.1 + 0.2
0.30000000000000004
>>> 8.6 - 2.4
6.199999999999999
علاوه بر این، دقت نوع float بین 15 تا 17 رقم است و اعدادی که تعداد ارقام بیشتری دارند،
به صورت تقریبی ذخیره
میشوند.
>>> 2.01234567890123456789
2.0123456789012346
در درس کار با اعداد، روش مواجهه با این خطاها را یاد
خواهیم گرفت اما فعلاً فقط بدانید که چنین خطاهایی وجود
دارند.
نوع complex در پایتون
در پایتون از اعداد مختلط هم به طور درونی پشتیبانی میشود و یک نوع built-in با نام complex برای کار با این
اعداد در نظر گرفته شده است. یک عدد مختلط دارای فرم کلی a + bj است که در آن، a بخش حقیقی (real) و b بخش
موهومی (imaginary) نامیده میشود. j هم عددی است که مجذور آن برابر با -1 است و در ریاضیات با i
نمایش داده
میشود. مجموعهی اعداد مختلط در واقع، یک اَبَرمجموعه برای مجموعهی اعداد حقیقی است و میتوان یک عدد مختلط
مثل a + bj را معادل یک نقطهی (a, b) در فضای دوبعدی دانست.
نوع str در پایتون
نوع str در پایتون برای کار با مقادیر متنی در نظر گرفته شده است. از کوتیشنها برای ایجاد
مقادیر یا رشتههای
متنی استفاده میشود.
>>> s1 = "Hello"
>>> s2 = 'Hi'
>>> s3 = "My friend's car"
همانطور که در این مثال میبینید، از هر دو نوع کوتیشن تکی و جفتی میتوانیم برای ایجاد رشتهها استفاده کنیم.
این امر باعث میشود بتوانیم از کاراکترهای کوتیشن درون رشتهها استفاده کنیم.
اگر بخواهیم یک رشتهی چندخطی ایجاد کنیم، میتوانیم از ''' ''' یا """ """ استفاده کنیم. یک فایل
پایتون با نام
builin_types.py ایجاد کنید و کد زیر را در آن وارد کنید.
builtin_types.py
s = '''This is
a multiline
string'''
print(s)
اگر برنامه را اجرا کنید، خواهید دید که رشته به همان شکلی که در برنامه وارد شده، در سه خط چاپ میشود. جزئیات
مربوط به رشتهها و نوع str را در درس کار با رشتههای متنی خواهیم دید.
نوع bool در پایتون
نوع bool در پایتون برای کار با مقادیر بولین در نظر گرفته شده است. مقادیر بولین مقادیری
هستند که میتوانند
برابر با True یا False باشند و بنابراین، نوع bool فقط شامل همین دو مقدار است. کاربرد
واقعی مقادیر بولین و
نوع bool را بعد از آشنایی با عملگرهای مقایسهای و منطقی و بهویژه هنگام کار با عبارات و
گزارههای شرطی
خواهیم دید.
کالکشنها در پایتون
کالکشنها در پایتون، نوعهایی هستند که میتوانند بیش از یک مقدار را در خود ذخیره کنند. در اینجا به یک معرفی
مختصر از هر یک از کالکشنهای پایتون بسنده میکنیم و در آینده آنها را مورد بررسی قرار میدهیم.
نوع list
لیستها رایجترین نوع کالکشن در پایتون هستند که تقریباً مشابه نوع آرایه در زبانهای دیگر هستند. یک لیست،
کالکشن یا دنبالهای از مقادیر است که ترتیب قرارگیری آنها مهم است و با استفاده از اندیس میتوان به آنها
دسترسی داشت. به علاوه، لیستها کالکشنهای تغییرپذیر هستند؛ یعنی میتوان آنها را به صورت درجا ویرایش کرد.
برای تعریف لیستها از براکت استفاده میشود.
>>> prime_numbers = [2, 3, 5, 7]
>>> prime_numbers[0]
2
>>> prime_numbers[3] = 11
>>> prime_numbers[3]
11
نوع tuple
تاپلها را میتوانیم ورژن تغییرناپذیر لیستها بدانیم. یعنی مثل لیستها، تاپلها هم ترتیبی هستند و با اندیس
میتوانیم به آیتمهای تاپل دسترسی داشته باشیم اما یک تاپل را نمیتوان به صورت درجا ویرایش کرد. تاپلها با
استفاده از پرانتز تعریف میشوند.
>>> prime_numbers = (2, 3, 5, 7)
>>> prime_numbers[0]
2
نوع range
از نوع range برای ایجاد بازههای عددی استفاده میشود. از این نوع بیش از هر جایی در
حلقههای for استفاده
میشود. سینتکس کلی برای ایجاد یک بازهی عددی به صورت range(start, stop, end) است که باعث میشود اعداد
صحیح
بازهی [start, stop) با طول گام step ایجاد شوند. کاربرد نوع range را در آینده خواهیم دید.
>>> r = range(1, 7)
>>> r[0]
1
>>> r[5]
6
نوع dict
نوع dict برای ایجاد یک کالکشن از مقادیر key و value کاربرد دارد. این کالکشنها که
دیکشنری نامیده میشوند، در
پایتون تغییرپذیرند و با استفاده از آکلادها ساخته میشوند. دسترسی به آیتمهای یک دیکشنری از طریق مقدار key
امکانپذیر است.
>>> d = {'name': 'lale', age: 4}
>>> d['name']
'lale'
>>> d['age']
4
نوعهای set و frozenset
نوع set برای ایجاد یک کالکشن از مقادیر غیرترتیبی و غیرتکراری کاربرد دارد. این کالکشن
همان چیزی است که در
ریاضیات مجموعه (Set) نامیده میشود. یک مجموعه در پایتون با استفاده از آکلادها ایجاد میشود و امکان ویرایش
درجای آن وجود دارد.
>>> s = {1, 2, 3}
>>> s
{1, 2, 3}
>>> s.remove(3)
>>> s
{1, 2}
نوع frozenset هم ورژن تغییرناپذیر set است؛ یعنی امکان ویرایش درجای
آن وجود ندارد.
تبدیل نوع در پایتون
متناظرر با هر یک از نوعهای built-in در پایتون، تابعی همنام با آن نوع وجود دارد که
برای تبدیل مقادیر سایر نوعها به آن نوع کاربرد دارد. برای مثال، برای نوع int یک تابع با
نام
int() داریم که آرگومانش را (در صورت امکان) به int تبدیل میکند.
مثال زیر را ببینید.
>>> int(1.2)
1
>>> int("12")
12
>>> int(True)
1
>>> int(False)
0
>>> float(1)
1.0
>>> float("1.2")
1.2
>>> float(True)
1.0
>>> float('inf')
inf
>>> float('nan')
nan
>>> bool(0)
False
>>>> bool(-8)
True
>>> bool(float('inf'))
True
>>> bool(float('nan'))
True
>>> bool("")
False
>>> bool("Hi")
True
برای نوعهای کالکشن هم توابع تبدیل مشابهی وجود دارد که امکان تبدیل کالکشنها به همدیگر را فراهم میکنند. این
توابع را هنگام بررسی
کالکشنهای پایتون خواهیم دید.