Kod bajtowy Javy

Kod bajtowy Javy – lista instrukcji do wykonania przez wirtualną maszynę Javy (JVM). Każdy kod operacji kodu bajtowego ma jeden bajt długości, chociaż niektóre kody operacji wymagają parametrów, co sprawia, że mamy dużo wielobajtowych instrukcji. Nigdy nie użyto wszystkich możliwych 256 kodów operacyjnych.

Związek z językiem Java

Programista języka Java w rzeczywistości nie musi wiedzieć, jak działa kod bajtowy Javy. Jednak w piśmie IBM developerWorks zasugerowano: „Znajomość kodu bajtowego Javy pomaga programiście tak, jak znajomość asemblera pomaga programistom języków C i C++[1].

Instrukcje

Każdy bajt może mieć 256 różnych wartości. Spośród nich w 0x00 przez 0xca, 0xfe, i 0xff są przypisane wartości. 0xba jest nieużywany z powodów historycznych. 0xca jest zarezerwowany jako instrukcja przerwania dla debuggerów i nie jest używany w języku. Podobnie 0xfe i 0xff nie są używane, gdyż zarezerwowane są do wewnętrznego użytku maszyny wirtualnej.

Instrukcje można podzielić na następujące grupy:

  • ładujące i zapisujące (np. aload_0, istore),
  • arytmetyczne i logiczne (np. ladd, fcmpl),
  • zmieniające typ (np. i2b, d2i),
  • tworzące obiekt i manipulujące nim (np. new, putfield),
  • przenoszące sterowanie (np. ifeq, goto),
  • wywołujące metodę i wracające z niej (np. invokespecial, areturn).

Jest też kilka instrukcji służących do bardziej wyspecjalizowanych czynności, np. zwracanie wyjątków, synchronizacja itd.

Duża część instrukcji ma też prefiksy lub sufiksy związane z typami zmiennych, na których pracują. Oto ich lista:

Prefiks/SufiksTyp w języku JavaOpisPrzyjmowane wartości
iint32-bitowy typ całkowity ze znakiem-231 .. 231-1
llong64-bitowy typ całkowity ze znakiem-263 .. 263-1
sshort16-bitowy typ całkowity ze znakiem-215 .. 215-1
bbyte8-bitowy typ całkowity ze znakiem-128 .. 127
cchar16-bitowy typ całkowity bez znaku0 .. 65 535
ffloat32-bitowy typ zmiennoprzecinkowyN/A
ddouble64-bitowy typ zmiennoprzecinkowyN/A
zboolean1-bitowy typ Booleanowski0 lub 1
aObject i pochodneReferencja do instancji klasy ObjectN/A

Na przykład, ladd dodaje do siebie dwie zmienne typu long, a sadd dwie zmienne typu short. Instrukcje „const”, „load” i „store” mogą ponadto posiadać sufiks wyglądający tak: „_n”, z tym, że w miejscu n podstawiamy liczbę od 0-3 dla instrukcji „load” i „store”. Największe możliwe n dla instrukcji „const” zależne jest od typu, na którym pracuje.

Model obliczeń

Dla przykładu, kod asemblera dla procesora x86 mógłby wyglądać tak:

 add eax, edx
 mov ecx, eax

Ten kod dodaje dwie liczby do siebie, a następnie przenosi je w inne miejsce. Robiący to samo kod bajtowy Javy wyglądałby następująco:

0 iload_1
1 iload_2
2 iadd
3 istore_3

W tym kodzie, dwie wartości które zostaną do siebie dodane umieszczane są na stosie, gdzie są pobierane przez instrukcję która je dodaje i wynik umieszcza na stosie. Instrukcja przechowywania następnie przenosi je do najwyższej wartości na obszarze stosu w lokacji zmiennej. Liczby przed instrukcjami to po prostu przesunięcie każdej instrukcji od początku metody. Metoda nazwana np. „pobierzNazwe()” mogłaby wyglądać tak:

Method java.lang.String pobierzNazwe()
0 aload_0       // Obiekt „this” jest zapisywany w lokacji 0 tabeli zmiennych
1 getfield #5 <Field java.lang.String nazwa>
                // Instrukcja ta pobiera obiekt z wierzchu stosu, zwraca wybrane
                // pole z niego i umieszcza je na stosie.
                // W tym przykładzie, pole o nazwie „nazwa” jest piątym polem klasy
4 areturn       // Zwraca obiekt na szczycie stosu z metody.

Przykład

Przykład kodu w Javie, źródło:

  outer:
  for (int i = 2; i < 1000; i++) {
      for (int j = 2; j < i; j++) {
          if (i % j == 0)
              continue outer;
      }
      System.out.println (i);
  }

Kompilator Javy generuje następujący kod bajtowy:

  0:   iconst_2
  1:   istore_1
  2:   iload_1
  3:   sipush  1000
  6:   if_icmpge       44
  9:   iconst_2
  10:  istore_2
  11:  iload_2
  12:  iload_1
  13:  if_icmpge       31
  16:  iload_1
  17:  iload_2
  18:  irem
  19:  ifne    25
  22:  goto    38
  25:  iinc    2, 1
  28:  goto    11
  31:  getstatic       #84; //Field java/lang/System.out:Ljava/io/PrintStream;
  34:  iload_1
  35:  invokevirtual   #85; //Method java/io/PrintStream.println:(I)V
  38:  iinc    1, 1
  41:  goto    2
  44:  return

Generowanie kodu

Najczęściej spotykanym językiem tworzący kod bajtowy Javy jest Java. Jest jeden oficjalny kompilator Javy, javac firmy Sun Microsystems, który kompiluje kod źródłowy Javy do kodu bajtowego Javy. Jednakże specyfikacja kodu bajtowego Javy jest ogólnodostępna, co sprawiło, że powstały kompilatory przystosowane do innych języków programowania.

Uruchamianie kodu

Kod bajtowy Javy zaprojektowany został, aby go uruchamiać na wirtualnej maszynie Javy.

Aby wygenerować kod maszynowy, można użyć aplikacji GCJ z pakietu GNU Compiler Collection.

Obsługa języków dynamicznych

JVM obecnie nie ma wbudowanej obsługi języków o dynamicznym systemie typów. Ponieważ istniejący zestaw instrukcji dla JVM jest w statycznym systemie typów, co oznacza, że wywołania metod mają przypisane sygnatury typów sprawdzane podczas kompilacji, bez mechanizmu odraczania sprawdzania do czasu uruchomienia kodu lub wybrania metody wysyłki przez alternatywny typ[2].

JSR 292 Supporting Dynamically Typed Languages on the JavaTM Platform (z ang. Obsługa języków o dynamicznym systemie typów na platformie JavaTM)[3] dodaje nową instrukcję invokedynamic, która umożliwia wywołanie metody opierając się na dynamicznym sprawdzaniu typów (zamiast istniejącej funkcji invokevirtual, która opiera się na statycznym sprawdzaniu typów).

Lista języków kompilowanych do kodu bajtowego Javy

Implementacje istniejących języków

JęzykImplementacje
AdaJGNAT
AdaMagic
AWKJawk[4]
CNestedVM, Cibyl, LLJVM, AMPC[5]
CobolMicro Focus JVM Visual COBOL[6]
Veryant isCobol[7]
ColdFusionAdobe ColdFusion
Railo
Open BlueDragon
Common LispArmed Bear Common Lisp[8]
CLforJava
Jatha
Component PascalGardens Point Component Pascal
ErlangErjang[9]
ForthmyForth[10]
JavaScriptRhino
LOGOjLogo[11]
XLogo[12]
LuaKahlua[13]
Luaj[14]
Jill[15]
Oberon-2Canterbury Oberon-2 for JVM
OCamlOCaml-Java[16]
PascalCanterbury Pascal for JVM
PHPIBM WebSphere sMash PHP (P8)[17]

Caucho Quercus[18]

PythonJython
Perl6Perl6
RexxIBM NetRexx
RubyJRuby
SchemeBigloo
Kawa
SISC
JScheme
TclJacl
JTcl[19]

Języki zaprojektowane dla kompilacji do kodu bajtowego Javy

  • Alef++[20], język programowania zainspirowany językami Perl i Lisp,
  • Ateji PX[21],
  • BBj, obiektowy język programowania zaprojektowany do pisania aplikacji biznesowych,
  • BeanShell, język skryptowy podobny w składni do Javy,
  • Ceylon,
  • ColdFusion, język skryptowy używany na serwerze aplikacji ColdFusion,
  • CAL, zainspirowany językiem Haskell funkcjonalny język programowania,
  • kod języka E może być kompilowany do kodu bajtowego Javy,
  • Fantom[22],
  • Flow Java,
  • Fortress, język zaprojektowany przez Sun, jako następca dla języka Fortran,
  • Frink,
  • Gosu, rozszerzalny język, którego kod jest kompilowany do kodu bajtowego Javy,
  • Hecl[23],
  • Ioke, język przypominający język Io, z podobieństwami do języka Ruby, Lisp i Smalltalk,
  • KBML,
  • Jabaco,
  • Jaskell[24], inspirowany językiem Haskell,
  • Jelly,
  • Join Java, język będący pochodną Javy,
  • Joy,
  • Judoscript,
  • Mirah[25], język programowania ze składnią przypominającą Ruby,
  • N.A.M.E. Basic,
  • NetLogo,
  • Nice,
  • Noop,
  • ObjectScript,
  • PHP.reboot[26] język, który przypomina język PHP,
  • Pizza, pochodna języka Java ze wskaźnikami i algebraicznymi typami danych,
  • Pnuts,
  • Scala[27]
  • Stab[28], w którym sposób programowania podobny jest do tego w języku C Sharp,
  • Sleep, proceduralny, skryptowy język programowania zainspirowany językami Perl i Objective-C.
  • kod języka V[29] może być kompilowany do kodu bajtowego Javy,
  • X10, język stworzony przez firmę IBM,
  • Yeti[30], funkcjonalny język programowania.


Przypisy

  1. Understanding bytecode makes you a better programmer (Rozumienie kodu bajtowego czyni cię lepszym programistą) (ang.).
  2. Charles Nutter: InvokeDynamic: Actually Useful? (ang.). 2007-01-03. [dostęp 2011-06-23].
  3. JSR 292 (ang.)
  4. Strona projektu Jawk (SourceForge)
  5. Strona główna projektu AMPC
  6. Strona Micro Focus JVM Visual COBOL. [dostęp 2011-06-23]. [zarchiwizowane z tego adresu (2011-06-01)].
  7. Veryant isCobol
  8. projekt ABCL
  9. Erjang Wiki
  10. Strona projektu myForth
  11. Strona projektu jLogo
  12. Strona projektu XLogo
  13. Strona projektu Kahlua
  14. Strona projektu Luaj (SourceForge)
  15. Strona projektu Jill (Google)
  16. Strona projektu OCaml
  17. Strona projektu IBM WebSphere sMash PHP. [dostęp 2011-06-23]. [zarchiwizowane z tego adresu (2018-07-22)].
  18. Strona projektu Caucho Quercus
  19. Strona projektu JTcl
  20. Strona projektu Alef++ (SourceForge)
  21. Strona projektu Ateji PX. [dostęp 2011-06-23]. [zarchiwizowane z tego adresu (2014-02-24)].
  22. Strona projektu Fantom
  23. Strona projektu Hecl
  24. Strona projektu Jaskell. [dostęp 2011-06-23]. [zarchiwizowane z tego adresu (2006-02-20)].
  25. Strona projektu Mirah
  26. Strona projektu PHP.reboot
  27. What is Scala? | The Scala Programming Language, www.scala-lang.org [dostęp 2017-06-16] [zarchiwizowane z adresu 2017-06-24].
  28. Strona projektu Stab (Google)
  29. Strona główna języka V. [dostęp 2011-06-23]. [zarchiwizowane z tego adresu (2010-04-13)].
  30. Strona języka Yeti. [dostęp 2011-06-23]. [zarchiwizowane z tego adresu (2011-07-11)].

Bibliografia