dep/xbyak: Update to v6.73
This commit is contained in:
parent
e3d9ba4c99
commit
bf15d13eb7
|
@ -226,10 +226,7 @@ endif()
|
||||||
|
|
||||||
|
|
||||||
# We don't need exceptions, disable them to save a bit of code size.
|
# We don't need exceptions, disable them to save a bit of code size.
|
||||||
# Except xbyak still uses them :(
|
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -fno-exceptions")
|
||||||
if(NOT ("${CPU_ARCH}" STREQUAL "x86" OR "${CPU_ARCH}" STREQUAL "x64"))
|
|
||||||
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -fno-exceptions")
|
|
||||||
endif()
|
|
||||||
|
|
||||||
|
|
||||||
# Write binaries to a seperate directory.
|
# Write binaries to a seperate directory.
|
||||||
|
|
|
@ -25,23 +25,3 @@ INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
|
||||||
CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
|
CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
|
||||||
ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF
|
ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF
|
||||||
THE POSSIBILITY OF SUCH DAMAGE.
|
THE POSSIBILITY OF SUCH DAMAGE.
|
||||||
-----------------------------------------------------------------------------
|
|
||||||
ソースコード形式かバイナリ形式か、変更するかしないかを問わず、以下の条件を満た
|
|
||||||
す場合に限り、再頒布および使用が許可されます。
|
|
||||||
|
|
||||||
ソースコードを再頒布する場合、上記の著作権表示、本条件一覧、および下記免責条項
|
|
||||||
を含めること。
|
|
||||||
バイナリ形式で再頒布する場合、頒布物に付属のドキュメント等の資料に、上記の著作
|
|
||||||
権表示、本条件一覧、および下記免責条項を含めること。
|
|
||||||
書面による特別の許可なしに、本ソフトウェアから派生した製品の宣伝または販売促進
|
|
||||||
に、著作権者の名前またはコントリビューターの名前を使用してはならない。
|
|
||||||
本ソフトウェアは、著作権者およびコントリビューターによって「現状のまま」提供さ
|
|
||||||
れており、明示黙示を問わず、商業的な使用可能性、および特定の目的に対する適合性
|
|
||||||
に関する暗黙の保証も含め、またそれに限定されない、いかなる保証もありません。
|
|
||||||
著作権者もコントリビューターも、事由のいかんを問わず、 損害発生の原因いかんを
|
|
||||||
問わず、かつ責任の根拠が契約であるか厳格責任であるか(過失その他の)不法行為で
|
|
||||||
あるかを問わず、仮にそのような損害が発生する可能性を知らされていたとしても、
|
|
||||||
本ソフトウェアの使用によって発生した(代替品または代用サービスの調達、使用の
|
|
||||||
喪失、データの喪失、利益の喪失、業務の中断も含め、またそれに限定されない)直接
|
|
||||||
損害、間接損害、偶発的な損害、特別損害、懲罰的損害、または結果損害について、
|
|
||||||
一切責任を負わないものとします。
|
|
||||||
|
|
|
@ -1,443 +1,80 @@
|
||||||
|
|
||||||
Xbyak 5.41 ; JIT assembler for x86(IA32), x64(AMD64, x86-64) by C++
|
# Xbyak 6.73 [![Badge Build]][Build Status]
|
||||||
=============
|
|
||||||
|
|
||||||
Abstract
|
*A C++ JIT assembler for x86 (IA32), x64 (AMD64, x86-64)*
|
||||||
-------------
|
|
||||||
|
|
||||||
This is a header file which enables dynamically to assemble x86(IA32), x64(AMD64, x86-64) mnemonic.
|
## Menu
|
||||||
|
|
||||||
Feature
|
- [Install]
|
||||||
-------------
|
- [Usage]
|
||||||
header file only
|
- [Changelog]
|
||||||
you can use Xbyak's functions at once if xbyak.h is included.
|
|
||||||
|
|
||||||
### Supported Instructions Sets
|
## Abstract
|
||||||
|
|
||||||
MMX/MMX2/SSE/SSE2/SSE3/SSSE3/SSE4/FPU(*partial*)/AVX/AVX2/FMA/VEX-encoded GPR/AVX-512
|
Xbyak is a C++ header library that enables dynamically to assemble x86(IA32), x64(AMD64, x86-64) mnemonic.
|
||||||
|
|
||||||
|
The pronunciation of Xbyak is `kəi-bja-k`.
|
||||||
|
It is named from a Japanese word [開闢](https://translate.google.com/?hl=ja&sl=ja&tl=en&text=%E9%96%8B%E9%97%A2&op=translate), which means the beginning of the world.
|
||||||
|
|
||||||
|
## Feature
|
||||||
|
|
||||||
|
- header file only
|
||||||
|
- Intel/MASM like syntax
|
||||||
|
- fully support AVX-512
|
||||||
|
|
||||||
|
**Note**:
|
||||||
|
Use `and_()`, `or_()`, ... instead of `and()`, `or()`.
|
||||||
|
If you want to use them, then specify `-fno-operator-names` option to gcc/clang.
|
||||||
|
|
||||||
|
### Derived Projects
|
||||||
|
- [Xbyak_aarch64](https://github.com/fujitsu/xbyak_aarch64/) : for AArch64
|
||||||
|
- [Xbyak_riscv](https://github.com/herumi/xbyak_riscv) : for RISC-V
|
||||||
|
|
||||||
|
### News
|
||||||
|
|
||||||
|
- add amx_fp16/avx_vnni_int8/avx_ne_convert/avx-ifma
|
||||||
|
- add movdiri, movdir64b, clwb, cldemote
|
||||||
|
- WAITPKG instructions (tpause, umonitor, umwait) are supported.
|
||||||
|
- MmapAllocator supports memfd with user-defined strings. see sample/memfd.cpp
|
||||||
|
- strictly check address offset disp32 in a signed 32-bit integer. e.g., `ptr[(void*)0xffffffff]` causes an error.
|
||||||
|
- define `XBYAK_OLD_DISP_CHECK` if you need an old check, but the option will be remoevd.
|
||||||
|
- add `jmp(mem, T_FAR)`, `call(mem, T_FAR)` `retf()` for far absolute indirect jump.
|
||||||
|
- vnni instructions such as vpdpbusd supports vex encoding.
|
||||||
|
- (break backward compatibility) `push(byte, imm)` (resp. `push(word, imm)`) forces to cast `imm` to 8(resp. 16) bit.
|
||||||
|
- (Windows) `#include <winsock2.h>` has been removed from xbyak.h, so add it explicitly if you need it.
|
||||||
|
- support exception-less mode see. [Exception-less mode](#exception-less-mode)
|
||||||
|
- `XBYAK_USE_MMAP_ALLOCATOR` will be defined on Linux/macOS unless `XBYAK_DONT_USE_MMAP_ALLOCATOR` is defined.
|
||||||
|
|
||||||
### Supported OS
|
### Supported OS
|
||||||
|
|
||||||
* Windows Xp, Vista, Windows 7(32bit, 64bit)
|
- Windows (Xp, Vista, 7, 10, 11) (32 / 64 bit)
|
||||||
* Linux(32bit, 64bit)
|
- Linux (32 / 64 bit)
|
||||||
* Intel Mac OSX
|
- macOS (Intel CPU)
|
||||||
|
|
||||||
### Supported Compilers
|
### Supported Compilers
|
||||||
|
|
||||||
* Visual Studio C++ VC2012 or later
|
Almost C++03 or later compilers for x86/x64 such as Visual Studio, g++, clang++, Intel C++ compiler and g++ on mingw/cygwin.
|
||||||
* gcc 4.7 or later
|
|
||||||
* clang 3.3
|
|
||||||
* cygwin gcc 4.5.3
|
|
||||||
* icc 7.2
|
|
||||||
|
|
||||||
>Note: Xbyak uses and(), or(), xor(), not() functions, so "-fno-operator-names" option is required on gcc.
|
## License
|
||||||
Or define XBYAK_NO_OP_NAMES and use and_(), or_(), xor_(), not_() instead of them.
|
|
||||||
and_(), or_(), xor_(), not_() are always available.
|
|
||||||
|
|
||||||
Install
|
[BSD-3-Clause License](http://opensource.org/licenses/BSD-3-Clause)
|
||||||
-------------
|
|
||||||
|
|
||||||
The following files are necessary. Please add the path to your compile directories.
|
## Author
|
||||||
|
|
||||||
* xbyak.h
|
#### 光成滋生 Mitsunari Shigeo
|
||||||
* xbyak_mnemonic.h
|
[GitHub](https://github.com/herumi) | [Website (Japanese)](http://herumi.in.coocan.jp/) | [herumi@nifty.com](mailto:herumi@nifty.com)
|
||||||
|
|
||||||
Linux:
|
## Sponsors welcome
|
||||||
|
[GitHub Sponsor](https://github.com/sponsors/herumi)
|
||||||
|
|
||||||
make install
|
<!----------------------------------------------------------------------------->
|
||||||
|
|
||||||
These files are copied into /usr/local/include/xbyak
|
[Badge Build]: https://github.com/herumi/xbyak/actions/workflows/main.yml/badge.svg
|
||||||
|
[Build Status]: https://github.com/herumi/xbyak/actions/workflows/main.yml
|
||||||
|
|
||||||
New Feature
|
[License]: COPYRIGHT
|
||||||
-------------
|
|
||||||
|
|
||||||
Add support for AVX-512 instruction set.
|
[Changelog]: doc/changelog.md
|
||||||
|
[Install]: doc/install.md
|
||||||
Syntax
|
[Usage]: doc/usage.md
|
||||||
-------------
|
|
||||||
|
|
||||||
Make Xbyak::CodeGenerator and make the class method and get the function
|
|
||||||
pointer by calling cgetCode() and casting the return value.
|
|
||||||
|
|
||||||
NASM Xbyak
|
|
||||||
mov eax, ebx --> mov(eax, ebx);
|
|
||||||
inc ecx inc(ecx);
|
|
||||||
ret --> ret();
|
|
||||||
|
|
||||||
### Addressing
|
|
||||||
|
|
||||||
(ptr|dword|word|byte) [base + index * (1|2|4|8) + displacement]
|
|
||||||
[rip + 32bit disp] ; x64 only
|
|
||||||
|
|
||||||
NASM Xbyak
|
|
||||||
mov eax, [ebx+ecx] --> mov (eax, ptr[ebx+ecx]);
|
|
||||||
test byte [esp], 4 --> test (byte [esp], 4);
|
|
||||||
|
|
||||||
|
|
||||||
How to use Selector(Segment Register)
|
|
||||||
|
|
||||||
>Note: Segment class is not derived from Operand.
|
|
||||||
|
|
||||||
```
|
|
||||||
mov eax, [fs:eax] --> putSeg(fs); mov(eax, ptr [eax]);
|
|
||||||
mov ax, cs --> mov(ax, cs);
|
|
||||||
```
|
|
||||||
|
|
||||||
>you can use ptr for almost memory access unless you specify the size of memory.
|
|
||||||
|
|
||||||
>dword, word and byte are member variables, then don't use dword as unsigned int, for example.
|
|
||||||
|
|
||||||
### AVX
|
|
||||||
|
|
||||||
vaddps(xmm1, xmm2, xmm3); // xmm1 <- xmm2 + xmm3
|
|
||||||
vaddps(xmm2, xmm3, ptr [rax]); // use ptr to access memory
|
|
||||||
vgatherdpd(xmm1, ptr [ebp+123+xmm2*4], xmm3);
|
|
||||||
|
|
||||||
*Remark*
|
|
||||||
The omitted destination syntax as the following ss disabled.
|
|
||||||
```
|
|
||||||
vaddps(xmm2, xmm3); // xmm2 <- xmm2 + xmm3
|
|
||||||
```
|
|
||||||
define `XBYAK_ENABLE_OMITTED_OPERAND` if you use it for backward compatibility.
|
|
||||||
But the newer version will not support it.
|
|
||||||
|
|
||||||
### AVX-512
|
|
||||||
|
|
||||||
```
|
|
||||||
vaddpd zmm2, zmm5, zmm30 --> vaddpd(zmm2, zmm5, zmm30);
|
|
||||||
vaddpd xmm30, xmm20, [rax] --> vaddpd(xmm30, xmm20, ptr [rax]);
|
|
||||||
vaddps xmm30, xmm20, [rax] --> vaddps(xmm30, xmm20, ptr [rax]);
|
|
||||||
vaddpd zmm2{k5}, zmm4, zmm2 --> vaddpd(zmm2 | k5, zmm4, zmm2);
|
|
||||||
vaddpd zmm2{k5}{z}, zmm4, zmm2 --> vaddpd(zmm2 | k5 | T_z, zmm4, zmm2);
|
|
||||||
vaddpd zmm2{k5}{z}, zmm4, zmm2,{rd-sae} --> vaddpd(zmm2 | k5 | T_z, zmm4, zmm2 | T_rd_sae);
|
|
||||||
vaddpd(zmm2 | k5 | T_z | T_rd_sae, zmm4, zmm2); // the position of `|` is arbitrary.
|
|
||||||
vcmppd k4{k3}, zmm1, zmm2, {sae}, 5 --> vcmppd(k4 | k3, zmm1, zmm2 | T_sae, 5);
|
|
||||||
|
|
||||||
vaddpd xmm1, xmm2, [rax+256] --> vaddpd(xmm1, xmm2, ptr [rax+256]);
|
|
||||||
vaddpd xmm1, xmm2, [rax+256]{1to2} --> vaddpd(xmm1, xmm2, ptr_b [rax+256]);
|
|
||||||
vaddpd ymm1, ymm2, [rax+256]{1to4} --> vaddpd(ymm1, ymm2, ptr_b [rax+256]);
|
|
||||||
vaddpd zmm1, zmm2, [rax+256]{1to8} --> vaddpd(zmm1, zmm2, ptr_b [rax+256]);
|
|
||||||
vaddps zmm1, zmm2, [rax+rcx*8+8]{1to16} --> vaddps(zmm1, zmm2, ptr_b [rax+rcx*8+8]);
|
|
||||||
vmovsd [rax]{k1}, xmm4 --> vmovsd(ptr [rax] | k1, xmm4);
|
|
||||||
|
|
||||||
vcvtpd2dq xmm16, oword [eax+33] --> vcvtpd2dq(xmm16, xword [eax+33]); // use xword for m128 instead of oword
|
|
||||||
vcvtpd2dq(xmm16, ptr [eax+33]); // default xword
|
|
||||||
vcvtpd2dq xmm21, [eax+32]{1to2} --> vcvtpd2dq(xmm21, ptr_b [eax+32]);
|
|
||||||
vcvtpd2dq xmm0, yword [eax+33] --> vcvtpd2dq(xmm0, yword [eax+33]); // use yword for m256
|
|
||||||
vcvtpd2dq xmm19, [eax+32]{1to4} --> vcvtpd2dq(xmm19, yword_b [eax+32]); // use yword_b to broadcast
|
|
||||||
|
|
||||||
vfpclassps k5{k3}, zword [rax+64], 5 --> vfpclassps(k5|k3, zword [rax+64], 5); // specify m512
|
|
||||||
vfpclasspd k5{k3}, [rax+64]{1to2}, 5 --> vfpclasspd(k5|k3, xword_b [rax+64], 5); // broadcast 64-bit to 128-bit
|
|
||||||
vfpclassps k5{k3}, [rax+64]{1to4}, 5 --> vfpclassps(k5|k3, xword_b [rax+64], 5); // broadcast 32-bit to 128-bit
|
|
||||||
```
|
|
||||||
Remark
|
|
||||||
* k1, ..., k7 are new opmask registers.
|
|
||||||
* use `| T_z`, `| T_sae`, `| T_rn_sae`, `| T_rd_sae`, `| T_ru_sae`, `| T_rz_sae` instead of `,{z}`, `,{sae}`, `,{rn-sae}`, `,{rd-sae}`, `,{ru-sae}`, `,{rz-sae}` respectively.
|
|
||||||
* `k4 | k3` is different from `k3 | k4`.
|
|
||||||
* use `ptr_b` for broadcast `{1toX}`. X is automatically determined.
|
|
||||||
* specify xword/yword/zword(_b) for m128/m256/m512 if necessary.
|
|
||||||
|
|
||||||
### Label
|
|
||||||
|
|
||||||
L("L1");
|
|
||||||
jmp ("L1");
|
|
||||||
|
|
||||||
jmp ("L2");
|
|
||||||
...
|
|
||||||
a few mnemonics(8-bit displacement jmp)
|
|
||||||
...
|
|
||||||
L("L2");
|
|
||||||
|
|
||||||
jmp ("L3", T_NEAR);
|
|
||||||
...
|
|
||||||
a lot of mnemonics(32-bit displacement jmp)
|
|
||||||
...
|
|
||||||
L("L3");
|
|
||||||
|
|
||||||
>Call hasUndefinedLabel() to verify your code has no undefined label.
|
|
||||||
> you can use a label for immediate value of mov like as mov (eax, "L2");
|
|
||||||
|
|
||||||
#### 1. support @@, @f, @b like MASM
|
|
||||||
|
|
||||||
L("@@"); // <A>
|
|
||||||
jmp("@b"); // jmp to <A>
|
|
||||||
jmp("@f"); // jmp to <B>
|
|
||||||
L("@@"); // <B>
|
|
||||||
jmp("@b"); // jmp to <B>
|
|
||||||
mov(eax, "@b");
|
|
||||||
jmp(eax); // jmp to <B>
|
|
||||||
|
|
||||||
#### 2. localization of label by calling inLocalLabel(), outLocallabel().
|
|
||||||
|
|
||||||
labels begining of period between inLocalLabel() and outLocalLabel()
|
|
||||||
are dealed with local label.
|
|
||||||
inLocalLabel() and outLocalLabel() can be nested.
|
|
||||||
|
|
||||||
void func1()
|
|
||||||
{
|
|
||||||
inLocalLabel();
|
|
||||||
L(".lp"); // <A> ; local label
|
|
||||||
...
|
|
||||||
jmp(".lp"); // jmpt to <A>
|
|
||||||
L("aaa"); // global label
|
|
||||||
outLocalLabel();
|
|
||||||
}
|
|
||||||
|
|
||||||
void func2()
|
|
||||||
{
|
|
||||||
inLocalLabel();
|
|
||||||
L(".lp"); // <B> ; local label
|
|
||||||
func1();
|
|
||||||
jmp(".lp"); // jmp to <B>
|
|
||||||
inLocalLabel();
|
|
||||||
}
|
|
||||||
|
|
||||||
### Label class
|
|
||||||
|
|
||||||
L() and jxx() functions support a new Label class.
|
|
||||||
|
|
||||||
Label label1, label2;
|
|
||||||
L(label1);
|
|
||||||
...
|
|
||||||
jmp(label1);
|
|
||||||
...
|
|
||||||
jmp(label2);
|
|
||||||
...
|
|
||||||
L(label2);
|
|
||||||
|
|
||||||
Moreover, assignL(dstLabel, srcLabel) method binds dstLabel with srcLabel.
|
|
||||||
|
|
||||||
Label label1, label2;
|
|
||||||
L(label1);
|
|
||||||
...
|
|
||||||
jmp(label2);
|
|
||||||
...
|
|
||||||
assignL(label2, label1); // label2 <= label1
|
|
||||||
|
|
||||||
The above jmp opecode jumps label1.
|
|
||||||
|
|
||||||
* Restriction:
|
|
||||||
* srcLabel must be used in L().
|
|
||||||
* dstLabel must not be used in L().
|
|
||||||
|
|
||||||
Label::getAddress() returns the address specified by the label instance and 0 if not specified.
|
|
||||||
```
|
|
||||||
// not AutoGrow mode
|
|
||||||
Label label;
|
|
||||||
assert(label.getAddress() == 0);
|
|
||||||
L(label);
|
|
||||||
assert(label.getAddress() == getCurr());
|
|
||||||
```
|
|
||||||
|
|
||||||
### Rip
|
|
||||||
```
|
|
||||||
Label label;
|
|
||||||
mov(eax, ptr [rip + label]); // eax = 4
|
|
||||||
...
|
|
||||||
|
|
||||||
L(label);
|
|
||||||
dd(4);
|
|
||||||
```
|
|
||||||
```
|
|
||||||
int x;
|
|
||||||
...
|
|
||||||
mov(eax, ptr[rip + &x]); // throw exception if the difference between &x and current position is larger than 2GiB
|
|
||||||
```
|
|
||||||
### Code size
|
|
||||||
The default max code size is 4096 bytes. Please set it in constructor of CodeGenerator() if you want to use large size.
|
|
||||||
|
|
||||||
class Quantize : public Xbyak::CodeGenerator {
|
|
||||||
public:
|
|
||||||
Quantize()
|
|
||||||
: CodeGenerator(8192)
|
|
||||||
{
|
|
||||||
}
|
|
||||||
...
|
|
||||||
};
|
|
||||||
|
|
||||||
### use user allocated memory
|
|
||||||
|
|
||||||
You can make jit code on prepaired memory.
|
|
||||||
|
|
||||||
class Sample : public Xbyak::CodeGenerator {
|
|
||||||
public:
|
|
||||||
Sample(void *userPtr, size_t size)
|
|
||||||
: Xbyak::CodeGenerator(size, userPtr)
|
|
||||||
{
|
|
||||||
...
|
|
||||||
}
|
|
||||||
};
|
|
||||||
|
|
||||||
const size_t codeSize = 1024;
|
|
||||||
uint8 buf[codeSize + 16];
|
|
||||||
|
|
||||||
// get 16-byte aligned address
|
|
||||||
uint8 *p = Xbyak::CodeArray::getAlignedAddress(buf);
|
|
||||||
|
|
||||||
// append executable attribute to the memory
|
|
||||||
Xbyak::CodeArray::protect(p, codeSize, true);
|
|
||||||
|
|
||||||
// construct your jit code on the memory
|
|
||||||
Sample s(p, codeSize);
|
|
||||||
|
|
||||||
>See *sample/test0.cpp*
|
|
||||||
|
|
||||||
AutoGrow
|
|
||||||
-------------
|
|
||||||
|
|
||||||
Under `AutoGrow` mode, Xbyak extends memory automatically if necessary.
|
|
||||||
Call ready() before calling getCode() to calc address of jmp.
|
|
||||||
```
|
|
||||||
struct Code : Xbyak::CodeGenerator {
|
|
||||||
Code()
|
|
||||||
: Xbyak::CodeGenerator(<default memory size>, Xbyak::AutoGrow)
|
|
||||||
{
|
|
||||||
...
|
|
||||||
}
|
|
||||||
};
|
|
||||||
Code c;
|
|
||||||
c.ready(); // Don't forget to call this function
|
|
||||||
```
|
|
||||||
>Don't use the address returned by getCurr() before calling ready().
|
|
||||||
>It may be invalid address.
|
|
||||||
>RESTRICTION : rip addressing is not supported in AutoGrow
|
|
||||||
|
|
||||||
Macro
|
|
||||||
-------------
|
|
||||||
|
|
||||||
* **XBYAK32** is defined on 32bit.
|
|
||||||
* **XBYAK64** is defined on 64bit.
|
|
||||||
* **XBYAK64_WIN** is defined on 64bit Windows(VC)
|
|
||||||
* **XBYAK64_GCC** is defined on 64bit gcc, cygwin
|
|
||||||
* define **XBYAK_NO_OP_NAMES** on gcc without `-fno-operator-names`
|
|
||||||
* define **XBYAK_ENABLE_OMITTED_OPERAND** if you use omitted destination such as `vaddps(xmm2, xmm3);`(duplicated in the future)
|
|
||||||
|
|
||||||
Sample
|
|
||||||
-------------
|
|
||||||
|
|
||||||
* test0.cpp ; tiny sample of Xbyak(x86, x64)
|
|
||||||
* quantize.cpp ; JIT optimized quantization by fast division(x86 only)
|
|
||||||
* calc.cpp ; assemble and estimate a given polynomial(x86, x64)
|
|
||||||
* bf.cpp ; JIT brainfuck(x86, x64)
|
|
||||||
|
|
||||||
License
|
|
||||||
-------------
|
|
||||||
|
|
||||||
modified new BSD License
|
|
||||||
http://opensource.org/licenses/BSD-3-Clause
|
|
||||||
|
|
||||||
The files under test/cybozu/ are copied from cybozulib(https://github.com/herumi/cybozulib/),
|
|
||||||
which is licensed by BSD-3-Clause and are used for only tests.
|
|
||||||
The header files under xbyak/ are independent of cybozulib.
|
|
||||||
|
|
||||||
History
|
|
||||||
-------------
|
|
||||||
* 2017/Jan/26 ver 5.41 add prefetchwt1 and support for scale == 0(thanks to rsdubtso)
|
|
||||||
* 2016/Dec/14 ver 5.40 add Label::getAddress() method to get the pointer specified by the label
|
|
||||||
* 2016/Dec/09 ver 5.34 fix handling of negative offsets when encoding disp8N(thanks to rsdubtso)
|
|
||||||
* 2016/Dec/08 ver 5.33 fix encoding of vpbroadcast{b,w,d,q}, vpinsr{b,w}, vpextr{b,w} for disp8N
|
|
||||||
* 2016/Dec/01 ver 5.32 rename __xgetbv() to _xgetbv() to support clang for Visual Studio(thanks to freiro)
|
|
||||||
* 2016/Nov/27 ver 5.31 rename AVX512_4VNNI to AVX512_4VNNIW
|
|
||||||
* 2016/Nov/27 ver 5.30 add AVX512_4VNNI, AVX512_4FMAPS instructions(thanks to rsdubtso)
|
|
||||||
* 2016/Nov/26 ver 5.20 add detection of AVX512_4VNNI and AVX512_4FMAPS(thanks to rsdubtso)
|
|
||||||
* 2016/Nov/20 ver 5.11 lost vptest for ymm(thanks to gregory38)
|
|
||||||
* 2016/Nov/20 ver 5.10 add addressing [rip+&var]
|
|
||||||
* 2016/Sep/29 ver 5.03 fix detection ERR_INVALID_OPMASK_WITH_MEMORY(thanks to PVS-Studio)
|
|
||||||
* 2016/Aug/15 ver 5.02 xbyak does not include xbyak_bin2hex.h
|
|
||||||
* 2016/Aug/15 ver 5.011 fix detection of version of gcc 5.4
|
|
||||||
* 2016/Aug/03 ver 5.01 disable omitted operand
|
|
||||||
* 2016/Jun/24 ver 5.00 support avx-512 instruction set
|
|
||||||
* 2016/Jun/13 avx-512 add mask instructions
|
|
||||||
* 2016/May/05 ver 4.91 add detection of AVX-512 to Xbyak::util::Cpu
|
|
||||||
* 2016/Mar/14 ver 4.901 comment to ready() function(thanks to skmp)
|
|
||||||
* 2016/Feb/04 ver 4.90 add jcc(const void *addr);
|
|
||||||
* 2016/Jan/30 ver 4.89 vpblendvb supports ymm reg(thanks to John Funnell)
|
|
||||||
* 2016/Jan/24 ver 4.88 lea, cmov supports 16-bit register(thanks to whyisthisfieldhere)
|
|
||||||
* 2015/Oct/05 ver 4.87 support segment selectors
|
|
||||||
* 2015/Aug/18 ver 4.86 fix [rip + label] addressing with immediate value(thanks to whyisthisfieldhere)
|
|
||||||
* 2015/Aug/10 ver 4.85 Address::operator==() is not correct(thanks to inolen)
|
|
||||||
* 2015/Jun/22 ver 4.84 call() support variadic template if available(thanks to randomstuff)
|
|
||||||
* 2015/Jun/16 ver 4.83 support movbe(thanks to benvanik)
|
|
||||||
* 2015/May/24 ver 4.82 support detection of F16C
|
|
||||||
* 2015/Apr/25 ver 4.81 fix the condition to throw exception for setSize(thanks to whyisthisfieldhere)
|
|
||||||
* 2015/Apr/22 ver 4.80 rip supports label(thanks to whyisthisfieldhere)
|
|
||||||
* 2015/Jar/28 ver 4.71 support adcx, adox, cmpxchg, rdseed, stac
|
|
||||||
* 2014/Oct/14 ver 4.70 support MmapAllocator
|
|
||||||
* 2014/Jun/13 ver 4.62 disable warning of VC2014
|
|
||||||
* 2014/May/30 ver 4.61 support bt, bts, btr, btc
|
|
||||||
* 2014/May/28 ver 4.60 support vcvtph2ps, vcvtps2ph
|
|
||||||
* 2014/Apr/11 ver 4.52 add detection of rdrand
|
|
||||||
* 2014/Mar/25 ver 4.51 remove state information of unreferenced labels
|
|
||||||
* 2014/Mar/16 ver 4.50 support new Label
|
|
||||||
* 2014/Mar/05 ver 4.40 fix wrong detection of BMI/enhanced rep on VirtualBox
|
|
||||||
* 2013/Dec/03 ver 4.30 support Reg::cvt8(), cvt16(), cvt32(), cvt64()
|
|
||||||
* 2013/Oct/16 ver 4.21 label support std::string
|
|
||||||
* 2013/Jul/30 ver 4.20 [break backward compatibility] split Reg32e class into RegExp(base+index*scale+disp) and Reg32e(means Reg32 or Reg64)
|
|
||||||
* 2013/Jul/04 ver 4.10 [break backward compatibility] change the type of Xbyak::Error from enum to a class
|
|
||||||
* 2013/Jun/21 ver 4.02 add putL(LABEL) function to put the address of the label
|
|
||||||
* 2013/Jun/21 ver 4.01 vpsllw, vpslld, vpsllq, vpsraw, vpsrad, vpsrlw, vpsrld, vpsrlq support (ymm, ymm, xmm).
|
|
||||||
support vpbroadcastb, vpbroadcastw, vpbroadcastd, vpbroadcastq(thanks to Gabest).
|
|
||||||
* 2013/May/30 ver 4.00 support AVX2, VEX-encoded GPR-instructions
|
|
||||||
* 2013/Mar/27 ver 3.80 support mov(reg, "label");
|
|
||||||
* 2013/Mar/13 ver 3.76 add cqo(), jcxz(), jecxz(), jrcxz()
|
|
||||||
* 2013/Jan/15 ver 3.75 add setSize() to modify generated code
|
|
||||||
* 2013/Jan/12 ver 3.74 add CodeGenerator::reset() ; add Allocator::useProtect()
|
|
||||||
* 2013/Jan/06 ver 3.73 use unordered_map if possible
|
|
||||||
* 2012/Dec/04 ver 3.72 eax, ebx, ... are member variables of CodeGenerator(revert), Xbyak::util::eax, ... are static const.
|
|
||||||
* 2012/Nov/17 ver 3.71 and_(), or_(), xor_(), not_() are available if XBYAK_NO_OP_NAMES is not defined.
|
|
||||||
* 2012/Nov/17 change eax, ebx, ptr and so on in CodeGenerator as static member and alias of them are defined in Xbyak::util.
|
|
||||||
* 2012/Nov/09 ver 3.70 XBYAK_NO_OP_NAMES macro is added to use and_() instead of and() (thanks to Mattias)
|
|
||||||
* 2012/Nov/01 ver 3.62 add fwait/fnwait/finit/fninit
|
|
||||||
* 2012/Nov/01 ver 3.61 add fldcw/fstcw
|
|
||||||
* 2012/May/03 ver 3.60 change interface of Allocator
|
|
||||||
* 2012/Mar/23 ver 3.51 fix userPtr mode
|
|
||||||
* 2012/Mar/19 ver 3.50 support AutoGrow mode
|
|
||||||
* 2011/Nov/09 ver 3.05 fix bit property of rip addresing / support movsxd
|
|
||||||
* 2011/Aug/15 ver 3.04 fix dealing with imm8 such as add(dword [ebp-8], 0xda); (thanks to lolcat)
|
|
||||||
* 2011/Jun/16 ver 3.03 fix __GNUC_PREREQ macro for Mac gcc(thanks to t_teruya)
|
|
||||||
* 2011/Apr/28 ver 3.02 do not use xgetbv on Mac gcc
|
|
||||||
* 2011/May/24 ver 3.01 fix typo of OSXSAVE
|
|
||||||
* 2011/May/23 ver 3.00 add vcmpeqps and so on
|
|
||||||
* 2011/Feb/16 ver 2.994 beta add vmovq for 32-bit mode(I forgot it)
|
|
||||||
* 2011/Feb/16 ver 2.993 beta remove cvtReg to avoid thread unsafe
|
|
||||||
* 2011/Feb/10 ver 2.992 beta support one argument syntax for fadd like nasm
|
|
||||||
* 2011/Feb/07 ver 2.991 beta fix pextrw reg, xmm, imm(Thanks to Gabest)
|
|
||||||
* 2011/Feb/04 ver 2.99 beta support AVX
|
|
||||||
* 2010/Dec/08 ver 2.31 fix ptr [rip + 32bit offset], support rdtscp
|
|
||||||
* 2010/Oct/19 ver 2.30 support pclmulqdq, aesdec, aesdeclast, aesenc, aesenclast, aesimc, aeskeygenassist
|
|
||||||
* 2010/Jun/07 ver 2.29 fix call(<label>)
|
|
||||||
* 2010/Jun/17 ver 2.28 move some member functions to public
|
|
||||||
* 2010/Jun/01 ver 2.27 support encoding of mov(reg64, imm) like yasm(not nasm)
|
|
||||||
* 2010/May/24 ver 2.26 fix sub(rsp, 1000)
|
|
||||||
* 2010/Apr/26 ver 2.25 add jc/jnc(I forgot to implement them...)
|
|
||||||
* 2010/Apr/16 ver 2.24 change the prototype of rewrite() method
|
|
||||||
* 2010/Apr/15 ver 2.23 fix align() and xbyak_util.h for Mac
|
|
||||||
* 2010/Feb/16 ver 2.22 fix inLocalLabel()/outLocalLabel()
|
|
||||||
* 2009/Dec/09 ver 2.21 support cygwin(gcc 4.3.2)
|
|
||||||
* 2009/Nov/28 support a part of FPU
|
|
||||||
* 2009/Jun/25 fix mov(qword[rax], imm); (thanks to Martin)
|
|
||||||
* 2009/Mar/10 fix redundant REX.W prefix on jmp/call reg64
|
|
||||||
* 2009/Feb/24 add movq reg64, mmx/xmm; movq mmx/xmm, reg64
|
|
||||||
* 2009/Feb/13 movd(xmm7, dword[eax]) drops 0x66 prefix (thanks to Gabest)
|
|
||||||
* 2008/Dec/30 fix call in short relative address(thanks to kato san)
|
|
||||||
* 2008/Sep/18 support @@, @f, @b and localization of label(thanks to nobu-q san)
|
|
||||||
* 2008/Sep/18 support (ptr[rip + 32bit offset]) (thanks to Dango-Chu san)
|
|
||||||
* 2008/Jun/03 fix align(). mov(ptr[eax],1) throws ERR_MEM_SIZE_IS_NOT_SPECIFIED.
|
|
||||||
* 2008/Jun/02 support memory interface allocated by user
|
|
||||||
* 2008/May/26 fix protect() to avoid invalid setting(thanks to shinichiro_h san)
|
|
||||||
* 2008/Apr/30 add cmpxchg16b, cdqe
|
|
||||||
* 2008/Apr/29 support x64
|
|
||||||
* 2008/Apr/14 code refactoring
|
|
||||||
* 2008/Mar/12 add bsr/bsf
|
|
||||||
* 2008/Feb/14 fix output of sub eax, 1234 (thanks to Robert)
|
|
||||||
* 2007/Nov/5 support lock, xadd, xchg
|
|
||||||
* 2007/Nov/2 support SSSE3/SSE4 (thanks to Dango-Chu san)
|
|
||||||
* 2007/Feb/4 fix the bug that exception doesn't occur under the condition which the offset of jmp mnemonic without T_NEAR is over 127.
|
|
||||||
* 2007/Jan/21 fix the bug to create address like [disp] select smaller representation for mov (eax|ax|al, [disp])
|
|
||||||
* 2007/Jan/4 first version
|
|
||||||
|
|
||||||
Author
|
|
||||||
-------------
|
|
||||||
|
|
||||||
MITSUNARI Shigeo(herumi@nifty.com)
|
|
||||||
|
|
||||||
|
|
|
@ -1,5 +1,5 @@
|
||||||
|
|
||||||
C++用x86(IA-32), x64(AMD64, x86-64) JITアセンブラ Xbyak 5.41
|
C++用x86(IA-32), x64(AMD64, x86-64) JITアセンブラ Xbyak 6.73
|
||||||
|
|
||||||
-----------------------------------------------------------------------------
|
-----------------------------------------------------------------------------
|
||||||
◎概要
|
◎概要
|
||||||
|
@ -22,21 +22,21 @@
|
||||||
Intel Mac
|
Intel Mac
|
||||||
などで動作確認をしています。
|
などで動作確認をしています。
|
||||||
|
|
||||||
※ Xbyakはデフォルトでand(), or(), xor(), not()関数を使います。
|
※ and, orなどの代わりにand_, or_を使用してください。
|
||||||
gccではそれらを演算子として解釈してしまうため、-fno-operator-namesオプションを追加してコンパイルしてください。
|
and, orなどを使いたい場合は-fno-operator-namesをgcc/clangに指定してください。
|
||||||
あるいはXBYAK_NO_OP_NAMESを定義してand_(), or_(), xor_(), not_()を使ってください。
|
|
||||||
and_(), or_(), xor_(), not_()はXBYAK_NO_OP_NAMESされていないときでも使えます。
|
|
||||||
|
|
||||||
-----------------------------------------------------------------------------
|
-----------------------------------------------------------------------------
|
||||||
◎準備
|
◎準備
|
||||||
xbyak.h
|
xbyak.h
|
||||||
xbyak_bin2hex.h
|
xbyak_bin2hex.h
|
||||||
xbyak_mnemonic.h
|
|
||||||
これらを同一のパスに入れてインクルードパスに追加してください。
|
これらを同一のパスに入れてインクルードパスに追加してください。
|
||||||
|
|
||||||
Linuxではmake installで/usr/local/include/xbyakにコピーされます。
|
Linuxではmake installで/usr/local/include/xbyakにコピーされます。
|
||||||
-----------------------------------------------------------------------------
|
-----------------------------------------------------------------------------
|
||||||
◎下位互換性の破れ
|
◎下位互換性の破れ
|
||||||
|
* push byte, immまたはpush word, immが下位8bit, 16bitにキャストした値を使うように変更。
|
||||||
|
* (Windows) `<winsock2.h>`をincludeしなくなったので必要なら明示的にincludeしてください。
|
||||||
|
* XBYAK_USE_MMAP_ALLOCATORがデフォルトで有効になりました。従来の方式にする場合はXBYAK_DONT_USE_MMAP_ALLOCATORを定義してください。
|
||||||
* Xbyak::Errorの型をenumからclassに変更
|
* Xbyak::Errorの型をenumからclassに変更
|
||||||
** 従来のenumの値をとるにはintにキャストしてください。
|
** 従来のenumの値をとるにはintにキャストしてください。
|
||||||
* (古い)Reg32eクラスを(新しい)Reg32eとRegExpに分ける。
|
* (古い)Reg32eクラスを(新しい)Reg32eとRegExpに分ける。
|
||||||
|
@ -46,6 +46,13 @@ Linuxではmake installで/usr/local/include/xbyakにコピーされます。
|
||||||
-----------------------------------------------------------------------------
|
-----------------------------------------------------------------------------
|
||||||
◎新機能
|
◎新機能
|
||||||
|
|
||||||
|
例外なしモード追加
|
||||||
|
XBYAK_NO_EXCEPTIONを定義してコンパイルするとgcc/clangで-fno-exceptionsオプションでコンパイルできます。
|
||||||
|
エラーは例外の代わりに`Xbyak::GetError()`で通達されます。
|
||||||
|
この値が0でなければ何か問題が発生しています。
|
||||||
|
この値は自動的に変更されないので`Xbyak::ClearError()`でリセットしてください。
|
||||||
|
`CodeGenerator::reset()`は`ClearError()`を呼びます。
|
||||||
|
|
||||||
MmapAllocator追加
|
MmapAllocator追加
|
||||||
これはUnix系OSでのみの仕様です。XBYAK_USE_MMAP_ALLOCATORを使うと利用できます。
|
これはUnix系OSでのみの仕様です。XBYAK_USE_MMAP_ALLOCATORを使うと利用できます。
|
||||||
デフォルトのAllocatorはメモリ確保時にposix_memalignを使います。
|
デフォルトのAllocatorはメモリ確保時にposix_memalignを使います。
|
||||||
|
@ -54,7 +61,6 @@ map countの最大値は/proc/sys/vm/max_map_countに書かれています。
|
||||||
デフォルトでは3万個ほどのXbyak::CodeGeneratorインスタンスを生成するとエラーになります。
|
デフォルトでは3万個ほどのXbyak::CodeGeneratorインスタンスを生成するとエラーになります。
|
||||||
test/mprotect_test.cppで確認できます。
|
test/mprotect_test.cppで確認できます。
|
||||||
これを避けるためにはmmapを使うMmapAllocatorを使ってください。
|
これを避けるためにはmmapを使うMmapAllocatorを使ってください。
|
||||||
将来この挙動がデフォルトになるかもしれません。
|
|
||||||
|
|
||||||
|
|
||||||
AutoGrowモード追加
|
AutoGrowモード追加
|
||||||
|
@ -155,15 +161,20 @@ vcvtpd2dq xmm19, [eax+32]{1to4} --> vcvtpd2dq(xmm19, yword_b [eax+32]);
|
||||||
|
|
||||||
vfpclassps k5{k3}, zword [rax+64], 5 --> vfpclassps(k5|k3, zword [rax+64], 5); // specify m512
|
vfpclassps k5{k3}, zword [rax+64], 5 --> vfpclassps(k5|k3, zword [rax+64], 5); // specify m512
|
||||||
vfpclasspd k5{k3}, [rax+64]{1to2}, 5 --> vfpclasspd(k5|k3, xword_b [rax+64], 5); // broadcast 64-bit to 128-bit
|
vfpclasspd k5{k3}, [rax+64]{1to2}, 5 --> vfpclasspd(k5|k3, xword_b [rax+64], 5); // broadcast 64-bit to 128-bit
|
||||||
vfpclassps k5{k3}, [rax+64]{1to4}, 5 --> vfpclassps(k5|k3, xword_b [rax+64], 5); // broadcast 32-bit to 128-bit
|
vfpclassps k5{k3}, [rax+64]{1to4}, 5 --> vfpclassps(k5|k3, xword_b [rax+64], 5); // broadcast 64-bit to 256-bit
|
||||||
|
|
||||||
|
|
||||||
|
vpdpbusd(xm0, xm1, xm2); // default encoding is EVEX
|
||||||
|
vpdpbusd(xm0, xm1, xm2, EvexEncoding); // same as the above
|
||||||
|
vpdpbusd(xm0, xm1, xm2, VexEncoding); // VEX encoding
|
||||||
|
setDefaultEncoding(VexEncoding); // default encoding is VEX
|
||||||
|
vpdpbusd(xm0, xm1, xm2); // VEX encoding
|
||||||
注意
|
注意
|
||||||
* k1, ..., k7 は新しいopmaskレジスタです。
|
* k1, ..., k7 は新しいopmaskレジスタです。
|
||||||
* z, sae, rn-sae, rd-sae, ru-sae, rz-saeの代わりにT_z, T_sae, T_rn_sae, T_rd_sae, T_ru_sae, T_rz_saeを使ってください。
|
* z, sae, rn-sae, rd-sae, ru-sae, rz-saeの代わりにT_z, T_sae, T_rn_sae, T_rd_sae, T_ru_sae, T_rz_saeを使ってください。
|
||||||
* `k4 | k3`と`k3 | k4`は意味が異なります。
|
* `k4 | k3`と`k3 | k4`は意味が異なります。
|
||||||
* {1toX}の代わりにptr_bを使ってください。Xは自動的に決まります。
|
* {1toX}の代わりにptr_bを使ってください。Xは自動的に決まります。
|
||||||
* 一部の命令はメモリサイズを指定するためにxword/yword/zword(_b)を使ってください。
|
* 一部の命令はメモリサイズを指定するためにxword/yword/zword(_b)を使ってください。
|
||||||
|
* setDefaultEncoding()でencoding省略時のEVEX/VEXを設定できます。
|
||||||
|
|
||||||
・ラベル
|
・ラベル
|
||||||
|
|
||||||
|
@ -245,8 +256,8 @@ void func2()
|
||||||
|
|
||||||
更にラベルの割り当てを行うassignL(dstLabel, srcLabel)という命令も追加されました。
|
更にラベルの割り当てを行うassignL(dstLabel, srcLabel)という命令も追加されました。
|
||||||
|
|
||||||
Label label1, label2;
|
Label label2;
|
||||||
L(label1);
|
Label label1 = L(); // Label label1; L(label1);と同じ意味
|
||||||
...
|
...
|
||||||
jmp(label2);
|
jmp(label2);
|
||||||
...
|
...
|
||||||
|
@ -268,6 +279,24 @@ L(label);
|
||||||
assert(label.getAddress(), getCurr());
|
assert(label.getAddress(), getCurr());
|
||||||
```
|
```
|
||||||
|
|
||||||
|
4. farジャンプ
|
||||||
|
|
||||||
|
`jmp(mem, T_FAR)`, `call(mem, T_FAR)`, `retf()`をサポートします。
|
||||||
|
サイズを明示するために`ptr`の代わりに`word|dword|qword`を利用してください。
|
||||||
|
|
||||||
|
32bit
|
||||||
|
```
|
||||||
|
jmp(word[eax], T_FAR); // jmp m16:16(FF /5)
|
||||||
|
jmp(dword[eax], T_FAR); // jmp m16:32(FF /5)
|
||||||
|
```
|
||||||
|
|
||||||
|
64bit
|
||||||
|
```
|
||||||
|
jmp(word[rax], T_FAR); // jmp m16:16(FF /5)
|
||||||
|
jmp(dword[rax], T_FAR); // jmp m16:32(FF /5)
|
||||||
|
jmp(qword[rax], T_FAR); // jmp m16:64(REX.W FF /5)
|
||||||
|
```
|
||||||
|
|
||||||
・Xbyak::CodeGenerator()コンストラクタインタフェース
|
・Xbyak::CodeGenerator()コンストラクタインタフェース
|
||||||
|
|
||||||
@param maxSize [in] コード生成最大サイズ(デフォルト4096byte)
|
@param maxSize [in] コード生成最大サイズ(デフォルト4096byte)
|
||||||
|
@ -309,6 +338,41 @@ bool CodeArray::protect(const void *addr, size_t size, bool canExec);
|
||||||
*/
|
*/
|
||||||
uint8 *CodeArray::getAlignedAddress(uint8 *addr, size_t alignedSize = ALIGN_SIZE);
|
uint8 *CodeArray::getAlignedAddress(uint8 *addr, size_t alignedSize = ALIGN_SIZE);
|
||||||
|
|
||||||
|
・read/execモード
|
||||||
|
デフォルトのCodeGeneratorはコンストラクト時にJIT用の領域をread/write/execモードに設定して利用します。
|
||||||
|
コード生成時はread/writeでコード実行時にはread/execにしたい場合、次のようにしてください。
|
||||||
|
|
||||||
|
struct Code : Xbyak::CodeGenerator {
|
||||||
|
Code()
|
||||||
|
: Xbyak::CodeGenerator(4096, Xbyak::DontUseProtect) // JIT領域をread/writeのままコード生成
|
||||||
|
{
|
||||||
|
mov(eax, 123);
|
||||||
|
ret();
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
Code c;
|
||||||
|
c.setProtectModeRE(); // read/execモードに変更
|
||||||
|
// JIT領域を実行
|
||||||
|
|
||||||
|
AutoGrowの場合はreadyの代わりにreadyRE()を読んでください。
|
||||||
|
|
||||||
|
struct Code : Xbyak::CodeGenerator {
|
||||||
|
Code()
|
||||||
|
: Xbyak::CodeGenerator(4096, Xbyak::AutoGrow) // JIT領域をread/writeのままコード生成
|
||||||
|
{
|
||||||
|
mov(eax, 123);
|
||||||
|
ret();
|
||||||
|
}
|
||||||
|
};
|
||||||
|
|
||||||
|
Code c;
|
||||||
|
c.readyRE(); // read/exeモードに変更
|
||||||
|
// JIT領域を実行
|
||||||
|
|
||||||
|
setProtectModeRW()を呼ぶと領域が元のread/execモードに戻ります。
|
||||||
|
|
||||||
|
|
||||||
その他詳細は各種サンプルを参照してください。
|
その他詳細は各種サンプルを参照してください。
|
||||||
-----------------------------------------------------------------------------
|
-----------------------------------------------------------------------------
|
||||||
◎マクロ
|
◎マクロ
|
||||||
|
@ -335,14 +399,104 @@ http://opensource.org/licenses/BSD-3-Clause
|
||||||
sample/{echo,hello}.bfは http://www.kmonos.net/alang/etc/brainfuck.php から
|
sample/{echo,hello}.bfは http://www.kmonos.net/alang/etc/brainfuck.php から
|
||||||
いただきました。
|
いただきました。
|
||||||
|
|
||||||
test/cybozu/以下のファイルはcybozulib(https://github.com/herumi/cybozulib/)
|
|
||||||
の一部を使っています。cybozulibはBSD-3-Clauseライセンスです。
|
|
||||||
cybozulibは単体テストでのみ利用されていて、xbyak/ディレクトリ以下のヘッダ
|
|
||||||
ファイルはcybozulibとは独立に利用できます。
|
|
||||||
|
|
||||||
-----------------------------------------------------------------------------
|
-----------------------------------------------------------------------------
|
||||||
◎履歴
|
◎履歴
|
||||||
|
|
||||||
|
2023/08/07 ver 6.73 sha512/sm3/sm4/avx-vnni-int16追加
|
||||||
|
2023/08/02 ver 6.72 xabort, xbegin, xend追加
|
||||||
|
2023/07/27 ver 6.71 Allocatorでhuge pageを考慮する。
|
||||||
|
2023/07/05 ver 6.70 vpclmulqdqのailas追加
|
||||||
|
2023/06/27 ver 6.69.2 `TypeT operator|`にconstexpr追加(thanks to Wunkolo)
|
||||||
|
2023/03/23 ver 6.69.1 xsave判定追加(thanks to Wunkolo)
|
||||||
|
2023/02/20 ver 6.69 util::CpuがAMD対応 UINTR命令対応
|
||||||
|
2022/12/07 ver 6.68 prefetchit{0,1}サポート
|
||||||
|
2022/11/30 ver 6.67 CMPccXADDサポート
|
||||||
|
2022/11/25 ver 6.66 RAO-INTサポート
|
||||||
|
2022/11/22 ver 6.65 x32動作確認
|
||||||
|
2022/11/04 ver 6.64 vmov*命令をmaskつきアドレッシング対応修正
|
||||||
|
2022/10/06 ver 6.63 AVX-IFMA用のvpmadd52{h,l}uq対応
|
||||||
|
2022/10/05 amx_fp16/avx_vnni_int8/avx_ne_convertt対応とsetDefaultEncoding()追加
|
||||||
|
2022/09/15 ver 6.62 serialize追加
|
||||||
|
2022/08/02 ver 6.61.1 noexceptはVisual Studio 2015以降対応
|
||||||
|
2022/07/29 ver 6.61 movzx eax, ahがエラーになるのを修正
|
||||||
|
2022/06/16 ver 6.60.2 GFNI, VAES, VPCLMULQDQの判定修正
|
||||||
|
2022/06/15 ver 6.60.1 Visual Studio /O0でXbyak::util::Cpuがリンクエラーになるのに対応
|
||||||
|
2022/06/06 ver 6.60 バージョンのつけ方を数値が戻らないように変更
|
||||||
|
2022/06/01 ver 6.06 Cpu::TypeクラスのリファクタリングとXBYAK_USE_MEMFDが定義されたときのMmapAllocatorの改善
|
||||||
|
2022/05/20 ver 6.052 Cpu::operator==()を正しく定義
|
||||||
|
2022/05/13 ver 6.051 XYBAK_NO_EXCEPTIONを定義したときのCpuクラスのコンパイルエラー修正
|
||||||
|
2022/05/12 ver 6.05 movdiri, movdir64b, clwb, cldemoteを追加
|
||||||
|
2022/04/05 ver 6.04 tpause, umonitor, umwaitを追加
|
||||||
|
2022/03/08 ver 6.03 MmapAllocatorがmemfd用のユーザ定義文字列をサポート
|
||||||
|
2022/01/28 ver 6.02 dispacementの32bit範囲チェックの厳密化
|
||||||
|
2021/12/14 ver 6.01 T_FAR jump/callとretfをサポート
|
||||||
|
2021/09/14 ver 6.00 AVX512-FP16を完全サポート
|
||||||
|
2021/09/09 ver 5.997 vrndscale*を{sae}をサポートするよう修正
|
||||||
|
2021/09/03 ver 5.996 v{add,sub,mul,div,max,min}{sd,ss}をT_rd_saeなどをサポートするよう修正
|
||||||
|
2021/08/15 ver 5.995 Linux上でXBYAK_USE_MEMFDが定義されたなら/proc/self/mapsにラベル追加
|
||||||
|
2021/06/17 ver 5.994 マスクレジスタ用のvcmpXX{ps,pd,ss,sd}のalias追加
|
||||||
|
2021/06/06 ver 5.993 gather/scatterのレジスタの組み合わせの厳密なチェック
|
||||||
|
2021/05/09 ver 5.992 endbr32とendbr64のサポート
|
||||||
|
2020/11/16 ver 5.991 g++-5のC++14でconstexpr機能の抑制
|
||||||
|
2020/10/19 ver 5.99 VNNI命令サポート(Thanks to akharito)
|
||||||
|
2020/10/17 ver 5.98 [scale * reg]のサポート
|
||||||
|
2020/09/08 ver 5.97 uint32などをuint32_tに置換
|
||||||
|
2020/08/28 ver 5.95 レジスタクラスのコンストラクタがconstexprに対応(C++14以降)
|
||||||
|
2020/08/04 ver 5.941 `CodeGenerator::reset()`が`ClearError()`を呼ぶように変更
|
||||||
|
2020/07/28 ver 5.94 #include <winsock2.h>の削除 (only windows)
|
||||||
|
2020/07/21 ver 5.93 例外なしモード追加
|
||||||
|
2020/06/30 ver 5.92 Intel AMX命令サポート (Thanks to nshustrov)
|
||||||
|
2020/06/19 ver 5.913 32ビット環境でXBYAK64を定義したときのmov(r64, imm64)を修正
|
||||||
|
2020/06/19 ver 5.912 macOSの古いXcodeでもMAP_JITを有効にする(Thanks to rsdubtso)
|
||||||
|
2020/05/10 ver 5.911 Linux/macOSでXBYAK_USE_MMAP_ALLOCATORがデフォルト有効になる
|
||||||
|
2020/04/20 ver 5.91 マスクレジスタk0を受け入れる(マスクをしない)
|
||||||
|
2020/04/09 ver 5.90 kmov{b,w,d,q}がサポートされないレジスタを受けると例外を投げる
|
||||||
|
2020/02/26 ver 5.891 zm0のtype修正
|
||||||
|
2020/01/03 ver 5.89 vfpclasspdの処理エラー修正
|
||||||
|
2019/12/20 ver 5.88 Windowsでのコンパイルエラー修正
|
||||||
|
2019/12/19 ver 5.87 未定義ラベルへのjmp命令のデフォルト挙動をT_NEARにするsetDefaultJmpNEAR()を追加
|
||||||
|
2019/12/13 ver 5.86 [変更] -fno-operator-namesが指定されたときは5.84以前の挙動に戻す
|
||||||
|
2019/12/07 ver 5.85 mmapにMAP_JITフラグを追加(macOS mojave以上)
|
||||||
|
2019/11/29 ver 5.84 [変更] XBYAK_USE_OP_NAMESが定義されていない限りXBYAK_NO_OP_NAMESが定義されるように変更
|
||||||
|
2019/10/12 ver 5.83 exit(1)の除去
|
||||||
|
2019/09/23 ver 5.82 monitorx, mwaitx, clzero対応 (thanks to MagurosanTeam)
|
||||||
|
2019/09/14 ver 5.81 いくつかの一般命令をサポート
|
||||||
|
2019/08/01 ver 5.802 AVX512_BF16判定修正 (thanks to vpirogov)
|
||||||
|
2019/05/27 support vp2intersectd, vp2intersectq (not tested)
|
||||||
|
2019/05/26 ver 5.80 support vcvtne2ps2bf16, vcvtneps2bf16, vdpbf16ps
|
||||||
|
2019/04/27 ver 5.79 vcmppd/vcmppsのptr_b対応忘れ(thanks to jkopinsky)
|
||||||
|
2019/04/15 ver 5.78 Reg::changeBit()のリファクタリング(thanks to MerryMage)
|
||||||
|
2019/03/06 ver 5.77 LLCキャッシュを共有数CPU数の修整(by densamoilov)
|
||||||
|
2019/01/17 ver 5.76 Cpu::getNumCores()追加(by shelleygoel)
|
||||||
|
2018/10/31 ver 5.751 互換性のためにXbyak::CastToの復元
|
||||||
|
2018/10/29 ver 5.75 LabelManagerのデストラクタでLabelから参照を切り離す
|
||||||
|
2018/10/21 ver 5.74 RegRip +/intの形をサポート Xbyak::CastToを削除
|
||||||
|
2018/10/15 util::StackFrameでmovの代わりにpush/popを使う
|
||||||
|
2018/09/19 ver 5.73 vpslld, vpslldq, vpsllwなどの(reg, mem, imm8)に対するevexエンコーディング修整
|
||||||
|
2018/09/19 ver 5.72 fix the encoding of vinsertps for disp8N(Thanks to petercaday)
|
||||||
|
2018/08/27 ver 5.71 新しいlabelインスタンスを返すL()を追加
|
||||||
|
2018/08/27 ver 5.70 read/exec設定のためのsetProtectMode()とDontUseProtectの追加
|
||||||
|
2018/08/24 ver 5.68 indexが16以上のVSIBエンコーディングのバグ修正(thanks to petercaday)
|
||||||
|
2018/08/14 ver 5.67 Addressクラス内のmutableを削除 ; fix setCacheHierarchy for cloud vm
|
||||||
|
2018/07/26 ver 5.661 mingw64対応
|
||||||
|
2018/07/24 ver 5.66 protect()のmodeにCodeArray::PROTECT_REを追加
|
||||||
|
2018/06/26 ver 5.65 fix push(qword [mem])
|
||||||
|
2018/03/07 ver 5.64 Cpu()の中でzero divisionが出ることがあるのを修正
|
||||||
|
2018/02/14 ver 5.63 Cpu::setCacheHierarchy()の修正とclang<3.9のためのEvexModifierZero修正(thanks to mgouicem)
|
||||||
|
2018/02/13 ver 5.62 Cpu::setCacheHierarchy() by mgouicem and rsdubtso
|
||||||
|
2018/02/07 ver 5.61 vmov*がmem{k}{z}形式対応(忘れてた)
|
||||||
|
2018/01/24 ver 5.601 xword, ywordなどをXbyak::util名前空間に追加
|
||||||
|
2018/01/05 ver 5.60 Ice lake系命令対応(319433-030.pdf)
|
||||||
|
2017/08/22 ver 5.53 mpxエンコーディングバグ修正, bnd()プレフィクス追加
|
||||||
|
2017/08/18 ver 5.52 align修正(thanks to MerryMage)
|
||||||
|
2017/08/17 ver 5.51 multi-byte nop追加 align()はそれを使用する(thanks to inolen)
|
||||||
|
2017/08/08 ver 5.50 mpx追加(thanks to magurosan)
|
||||||
|
2017/08/08 ver 5.45 sha追加(thanks to magurosan)
|
||||||
|
2017/08/08 ver 5.44 prefetchw追加(thanks to rsdubtso)
|
||||||
|
2017/07/12 ver 5.432 PVS-studioの警告を減らす
|
||||||
|
2017/07/09 ver 5.431 hasRex()修正 (影響なし) (thanks to drillsar)
|
||||||
|
2017/05/14 ver 5.43 CodeGenerator::resetSize()修正(thanks to gibbed)
|
||||||
|
2017/05/13 ver 5.42 movs{b,w,d,q}追加
|
||||||
2017/01/26 ver 5.41 prefetcwt1追加とscale == 0対応(thanks to rsdubtso)
|
2017/01/26 ver 5.41 prefetcwt1追加とscale == 0対応(thanks to rsdubtso)
|
||||||
2016/12/14 ver 5.40 Labelが示すアドレスを取得するLabel::getAddress()追加
|
2016/12/14 ver 5.40 Labelが示すアドレスを取得するLabel::getAddress()追加
|
||||||
2016/12/07 ver 5.34 disp8N時の負のオフセット処理の修正(thanks to rsdubtso)
|
2016/12/07 ver 5.34 disp8N時の負のオフセット処理の修正(thanks to rsdubtso)
|
||||||
|
@ -458,7 +612,3 @@ cybozulibは単体テストでのみ利用されていて、xbyak/ディレク
|
||||||
◎著作権者
|
◎著作権者
|
||||||
|
|
||||||
光成滋生(MITSUNARI Shigeo, herumi@nifty.com)
|
光成滋生(MITSUNARI Shigeo, herumi@nifty.com)
|
||||||
|
|
||||||
---
|
|
||||||
$Revision: 1.56 $
|
|
||||||
$Date: 2010/04/16 11:58:22 $
|
|
||||||
|
|
File diff suppressed because it is too large
Load Diff
File diff suppressed because it is too large
Load Diff
File diff suppressed because it is too large
Load Diff
|
@ -127,7 +127,7 @@ target_link_libraries(core PRIVATE stb xxhash imgui rapidjson)
|
||||||
|
|
||||||
if(${CPU_ARCH} STREQUAL "x64")
|
if(${CPU_ARCH} STREQUAL "x64")
|
||||||
target_include_directories(core PUBLIC "${CMAKE_CURRENT_SOURCE_DIR}/../../dep/xbyak/xbyak")
|
target_include_directories(core PUBLIC "${CMAKE_CURRENT_SOURCE_DIR}/../../dep/xbyak/xbyak")
|
||||||
target_compile_definitions(core PUBLIC "WITH_RECOMPILER=1" "WITH_MMAP_FASTMEM=1")
|
target_compile_definitions(core PUBLIC "XBYAK_NO_EXCEPTION=1" "WITH_RECOMPILER=1" "WITH_MMAP_FASTMEM=1")
|
||||||
target_sources(core PRIVATE ${RECOMPILER_SRCS}
|
target_sources(core PRIVATE ${RECOMPILER_SRCS}
|
||||||
cpu_recompiler_code_generator_x64.cpp
|
cpu_recompiler_code_generator_x64.cpp
|
||||||
)
|
)
|
||||||
|
|
|
@ -13,6 +13,8 @@
|
||||||
<AdditionalIncludeDirectories Condition="'$(Platform)'!='ARM64'">%(AdditionalIncludeDirectories);$(SolutionDir)dep\rainterface</AdditionalIncludeDirectories>
|
<AdditionalIncludeDirectories Condition="'$(Platform)'!='ARM64'">%(AdditionalIncludeDirectories);$(SolutionDir)dep\rainterface</AdditionalIncludeDirectories>
|
||||||
|
|
||||||
<AdditionalIncludeDirectories Condition="'$(Platform)'=='x64'">%(AdditionalIncludeDirectories);$(SolutionDir)dep\xbyak\xbyak</AdditionalIncludeDirectories>
|
<AdditionalIncludeDirectories Condition="'$(Platform)'=='x64'">%(AdditionalIncludeDirectories);$(SolutionDir)dep\xbyak\xbyak</AdditionalIncludeDirectories>
|
||||||
|
<PreprocessorDefinitions Condition="'$(Platform)'=='x64'">XBYAK_NO_EXCEPTION=1;%(PreprocessorDefinitions)</PreprocessorDefinitions>
|
||||||
|
|
||||||
<AdditionalIncludeDirectories Condition="'$(Platform)'=='ARM' Or '$(Platform)'=='ARM64'">%(AdditionalIncludeDirectories);$(SolutionDir)dep\vixl\include</AdditionalIncludeDirectories>
|
<AdditionalIncludeDirectories Condition="'$(Platform)'=='ARM' Or '$(Platform)'=='ARM64'">%(AdditionalIncludeDirectories);$(SolutionDir)dep\vixl\include</AdditionalIncludeDirectories>
|
||||||
</ClCompile>
|
</ClCompile>
|
||||||
</ItemDefinitionGroup>
|
</ItemDefinitionGroup>
|
||||||
|
|
|
@ -66,7 +66,7 @@ enum class Condition : u8
|
||||||
|
|
||||||
#if defined(CPU_X64)
|
#if defined(CPU_X64)
|
||||||
|
|
||||||
using HostReg = Xbyak::Operand::Code;
|
using HostReg = unsigned;
|
||||||
using CodeEmitter = Xbyak::CodeGenerator;
|
using CodeEmitter = Xbyak::CodeGenerator;
|
||||||
using LabelType = Xbyak::Label;
|
using LabelType = Xbyak::Label;
|
||||||
enum : u32
|
enum : u32
|
||||||
|
|
Loading…
Reference in New Issue