#include "Emulator/Graphics/Objects/GpuMemory.h" #include "Kyty/Core/Database.h" #include "Kyty/Core/DbgAssert.h" #include "Kyty/Core/Hashmap.h" #include "Kyty/Core/MagicEnum.h" #include "Kyty/Core/String.h" #include "Kyty/Core/Threads.h" #include "Kyty/Core/Vector.h" #include "Emulator/Config.h" #include "Emulator/Graphics/GraphicContext.h" #include "Emulator/Graphics/GraphicsRun.h" #include "Emulator/Profiler.h" #include #include #include //#define XXH_INLINE_ALL #include #ifdef KYTY_EMU_ENABLED namespace Kyty::Libs::Graphics { constexpr int VADDR_BLOCKS_MAX = 3; enum class OverlapType : uint64_t { None, Equals, Crosses, Contains, IsContainedWithin, Max }; constexpr uint64_t ObjectsRelation(GpuMemoryObjectType b, OverlapType relation, GpuMemoryObjectType a) { return static_cast(a) * static_cast(GpuMemoryObjectType::Max) * static_cast(OverlapType::Max) + static_cast(b) * static_cast(OverlapType::Max) + static_cast(relation); } static bool addr_in_block(uint64_t block_addr, uint64_t block_size, uint64_t addr) { return addr >= block_addr && addr < block_addr + block_size; }; static OverlapType GetOverlapType(uint64_t vaddr_a, uint64_t size_a, uint64_t vaddr_b, uint64_t size_b) { // KYTY_PROFILER_FUNCTION(); EXIT_IF(size_a == 0 || size_b == 0); if (vaddr_a == vaddr_b && size_a == size_b) { return OverlapType::Equals; } bool a_b = addr_in_block(vaddr_a, size_a, vaddr_b); bool a_lb = addr_in_block(vaddr_a, size_a, vaddr_b + size_b - 1); bool b_a = addr_in_block(vaddr_b, size_b, vaddr_a); bool b_la = addr_in_block(vaddr_b, size_b, vaddr_a + size_a - 1); if (a_b && a_lb) { return OverlapType::Contains; } if (b_a && b_la) { return OverlapType::IsContainedWithin; } if ((a_b && b_la) || (b_a && a_lb)) { return OverlapType::Crosses; } return OverlapType::None; } class GpuMap1 { public: GpuMap1() = default; ~GpuMap1() = default; KYTY_CLASS_NO_COPY(GpuMap1); void Insert(uint64_t vaddr, int id) { auto& ids = m_map[vaddr]; if (!ids.Contains(id)) { ids.Add(id); } } void Erase(uint64_t vaddr, int id) { auto& ids = m_map[vaddr]; ids.Remove(id); if (ids.IsEmpty()) { m_map.Remove(vaddr); } } [[nodiscard]] Vector FindAll(uint64_t vaddr) const { return m_map.Get(vaddr); } [[nodiscard]] bool IsEmpty() const { int num = 0; m_map.ForEach( [](auto /*key*/, auto value, void* arg) { (*static_cast(arg)) += value->Size(); return true; }, &num); return num == 0; } private: Core::Hashmap> m_map; }; class GpuMap2 { public: GpuMap2() = default; ~GpuMap2() = default; KYTY_CLASS_NO_COPY(GpuMap2); void Insert(uint64_t vaddr, uint64_t size, int id) { EXIT_IF(size == 0); auto first_page = CalcPageId(vaddr); auto last_page = CalcPageId(vaddr + size - 1); EXIT_IF(last_page < first_page); for (auto page = first_page; page <= last_page; page++) { auto& ids = m_map[page]; if (!ids.Contains(id)) { ids.Add(id); } } } void Erase(uint64_t vaddr, uint64_t size, int id) { EXIT_IF(size == 0); auto first_page = CalcPageId(vaddr); auto last_page = CalcPageId(vaddr + size - 1); EXIT_IF(last_page < first_page); for (auto page = first_page; page <= last_page; page++) { auto& ids = m_map[page]; ids.Remove(id); if (ids.IsEmpty()) { m_map.Remove(page); } } } [[nodiscard]] Vector FindAll(uint64_t vaddr, uint64_t size) const { Vector ret; EXIT_IF(size == 0); auto first_page = CalcPageId(vaddr); auto last_page = CalcPageId(vaddr + size - 1); EXIT_IF(last_page < first_page); for (auto page = first_page; page <= last_page; page++) { for (int id: m_map.Get(page)) { if (!ret.Contains(id)) { ret.Add(id); } } } return ret; } [[nodiscard]] Vector FindAll(const uint64_t* vaddr, const uint64_t* size, int vaddr_num) const { EXIT_IF(vaddr == nullptr); EXIT_IF(size == nullptr); Vector ret; for (int i = 0; i < vaddr_num; i++) { EXIT_IF(size[i] == 0); auto first_page = CalcPageId(vaddr[i]); auto last_page = CalcPageId(vaddr[i] + size[i] - 1); EXIT_IF(last_page < first_page); for (auto page = first_page; page <= last_page; page++) { for (int id: m_map.Get(page)) { if (!ret.Contains(id)) { ret.Add(id); } } } } return ret; } [[nodiscard]] bool IsEmpty() const { int num = 0; m_map.ForEach( [](auto /*key*/, auto value, void* arg) { (*static_cast(arg)) += value->Size(); return true; }, &num); return num == 0; } private: static constexpr uint32_t PAGE_BITS = 14u; static uint32_t CalcPageId(uint64_t vaddr) { EXIT_IF((vaddr >> (PAGE_BITS + 32u)) != 0); return static_cast(vaddr >> PAGE_BITS); } Core::Hashmap> m_map; }; class GpuMemory { public: GpuMemory() { EXIT_NOT_IMPLEMENTED(!Core::Thread::IsMainThread()); DbgInit(); } virtual ~GpuMemory() { KYTY_NOT_IMPLEMENTED; } KYTY_CLASS_NO_COPY(GpuMemory); bool IsAllocated(uint64_t vaddr, uint64_t size); void SetAllocatedRange(uint64_t vaddr, uint64_t size); void Free(GraphicContext* ctx, uint64_t vaddr, uint64_t size, bool unmap); void* CreateObject(uint64_t submit_id, GraphicContext* ctx, CommandBuffer* buffer, const uint64_t* vaddr, const uint64_t* size, int vaddr_num, const GpuObject& info); void ResetHash(const uint64_t* vaddr, const uint64_t* size, int vaddr_num, GpuMemoryObjectType type); void FrameDone(); Vector FindObjects(const uint64_t* vaddr, const uint64_t* size, int vaddr_num, GpuMemoryObjectType type, bool exact, bool only_first); // Sync: GPU -> CPU void WriteBack(GraphicContext* ctx, CommandProcessor* cp); // Sync: CPU -> GPU void Flush(GraphicContext* ctx, uint64_t vaddr, uint64_t size); void FlushAll(GraphicContext* ctx); void DbgInit(); void DbgDbDump(); void DbgDbSave(const String& file_name); private: static constexpr int OBJ_OVERLAPS_MAX = 2; struct AllocatedRange { uint64_t vaddr = 0; uint64_t size = 0; }; struct ObjectInfo { GpuMemoryObject object; uint64_t params[GpuObject::PARAMS_MAX] = {}; uint64_t hash[VADDR_BLOCKS_MAX] = {}; uint64_t cpu_update_time = 0; uint64_t gpu_update_time = 0; uint64_t submit_id = 0; GpuObject::write_back_func_t write_back_func = nullptr; GpuObject::delete_func_t delete_func = nullptr; GpuObject::update_func_t update_func = nullptr; uint64_t use_last_frame = 0; uint64_t use_num = 0; bool in_use = false; bool read_only = false; bool check_hash = false; VulkanMemory mem; }; struct OverlappedBlock { OverlapType relation = OverlapType::None; int object_id = -1; }; struct Block { uint64_t vaddr[VADDR_BLOCKS_MAX] = {}; uint64_t size[VADDR_BLOCKS_MAX] = {}; int vaddr_num = 0; }; struct Object { Block block; ObjectInfo info; Vector others; GpuMemoryScenario scenario = GpuMemoryScenario::Common; bool free = true; int next_free_id = -1; }; struct Heap { AllocatedRange range; Vector