Format
tunggal-presisi floating-point format angka komputer yang menempati 4 byte (32
bit) dalam memori komputer dan merupakan dynamic range yang lebar dari
nilai-nilai dengan menggunakan floating point.
Dalam
IEEE 754-2008 basis 2 format 32-bit secara resmi disebut sebagai binary32. Itu
disebut tunggal dalam IEEE 754-1985. Pada komputer lama, format floating-point
lain dari 4 byte yang digunakan. Salah satu bahasa pemrograman pertama yang
menyediakan tipe data tunggal dan double-presisi floating-point adalah Fortran.
Sebelum adopsi IEEE 754-1985, representasi dan sifat ganda tipe data float
tergantung pada produsen komputer dan model komputer.
Single-presisi
biner floating-point digunakan karena jangkauan luas atas titik tetap (yang
sama-bit lebar), bahkan jika pada biaya presisi. Presisi tunggal dikenal
sebagai nyata dalam Fortran, [1] sebagai pelampung di C, C + +, C #, Java [2]
dan Haskell, dan sebagai single di Delphi (Pascal), Visual Basic, dan MATLAB.
Namun, mengambang di Python, Ruby, PHP, dan OCaml dan satu di versi Oktaf
sebelum 3.2 merujuk pada nomor presisi ganda. Dalam PostScript hanya presisi
floating-point tunggal.
Dalam contoh
ini:
\ text {} tanda
= 0
1 + \ sum_ {i =
1} ^ {23} b_ {23}-i 2 ^ {-i} = 1 + 2 ^ {-2} = 1,25
2 ^ {(e-127)} =
2 ^ {} 124-127 = 2 ^ {-3}
demikian:
\ text {value} =
1,25 \ kali 2 ^ {-3} = 0,15625
Dalam
komputasi, presisi ganda adalah format nomor komputer yang menempati dua lokasi
penyimpanan yang berdekatan dalam memori komputer. Sejumlah presisi ganda,
kadang-kadang hanya disebut ganda, dapat didefinisikan sebagai integer, titik
tetap, atau floating point (dalam hal ini sering disebut sebagai FP64). Komputer
modern dengan lokasi penyimpanan 32-bit menggunakan dua lokasi memori untuk
menyimpan nomor presisi ganda 64-bit (lokasi penyimpanan tunggal dapat
menampung sejumlah presisi tunggal). Presisi ganda floating-point merupakan
standar IEEE 754 untuk pengkodean biner atau desimal angka floating-point 64
bit (8 byte).
The
presisi ganda biner eksponen floating-point dikodekan menggunakan representasi
offset-biner, dengan offset nol menjadi 1023, juga dikenal sebagai Bias
eksponen dalam standar IEEE 754. Contoh representasi tersebut akan menjadi:
Emin (1) =
-1.022
E (50) = -973
Emax (2046) =
1023
Dengan
demikian, seperti yang didefinisikan oleh representasi offset-biner, untuk
mendapatkan eksponen benar bias eksponen 1023 harus dikurangkan dari eksponen
tertulis.
Para eksponen
00016 dan 7ff16 memiliki arti khusus:
00016 digunakan
untuk mewakili nol (jika M = 0) dan subnormals (jika M ≠ 0), dan
7ff16 digunakan
untuk mewakili ∞ (jika M = 0) dan NaN (jika M ≠ 0),
di mana M adalah
mantissa fraksi. Semua pola bit encoding yang valid.
Kecuali untuk
pengecualian atas, jumlah presisi ganda seluruh digambarkan oleh:
(-1) ^ {\ Text
{tanda}} \ kali 2 ^ {\ text {} eksponen - \ text {eksponen Bias}} \ kali 1 \
text {} mantissa.
from source:
Tidak ada komentar:
Posting Komentar