CONTROL4D: Pengeditan Potret Dinamis dengan Belajar 4d Gan Dari 2D Editor Basis Difusi | Simpury Scholar | Semantik Scalers

CONTROL4D: Pengeditan potret dinamis yang mempelajari 4D Gan dari editor basis difusi 2D

CONTROL4D dibangun berdasarkan ekspresi empa t-dimensi yang efisien oleh editor berdasarkan basis difusi du a-dimensi, dan dari sana untuk mempelajari GAN empat dimensi untuk menghindari sinyal pemantauan yang konsisten. Memperbesar

Simpan dan Simpan di Perpustakaan Buat peringatan Kutipan Membagikan 29 kutipan Kutipan yang sangat berpengaruh latar belakang Kutipan metode Kutipan hasil

Figures and Tables from this paper

Lihat 8 buah ara

Topics

Generasi ai

29 kutipan

Tipe yang dikutip File pdf Nama Penulis Filter lainnya Filter lainnya Menyaring

LatentEditor: Text Driven Local Editing of 3D Scenes

Ilmu Komputer, Teknik Tldr

Dalam makalah iniKerangka kerja inovatif yang dirancang untuk memberi pengguna kemampuan melakukan pengeditan area saraf secara akurat dan terkontrol secara lokal menggunakan perintah teks untuk koreksi lokal sambil menghemat area asing untuk menghitung topeng 2D dari ruang laten yang berfungsi sebagai panduan. ekspansi

  • 3 kutipan

menyimpan

Sculpt3D: Multi-View Consistent Text-to-3D Generation with Sparse 3D Prior

    Cheng ChengXiaofeng Yang +5 penulis Fayao Liu

ilmu Komputer Tldr

Dilengkapi dengan pipeline saat ini dengan secara eksplisit menyuntikkan prior 3D dari objek referensi yang diambil tanpa melatih ulang model difusi 2D, pemantauan titik kunci dengan pendekatan pengambilan sampel sinar jarang memberikan kualitas tinggi dan beragam. Kami memperkenalkan kerangka kerja baru, Sculpt3D, yang menunjukkan jaminan geometri 3D. ekspansi

  • 1 kutipan

menyimpan

DynVideo-E: Harnessing Dynamic NeRF for Large-Scale Motion- and View-Change Human-Centric Video Editing

    Jia-Wei LiuYan-Pei Cao +6 Penulis Mike Zheng Shou

ilmu Komputer Tldr

Dalam makalah ini, kami memperkenalkan teknik inovatif seperti pengambilan sampel distorsi skor multi-pose (SDS) multi-tampilan, kehilangan rekonstruksi, resolusi super bagian lokal yang dipandu teks, dan transfer gaya dari prapemrosesan difusi diskrit 2D dan prapemrosesan difusi 3D mengusulkan saluran pengeditan video-NeRF berbasis gambar yang mencakup desain. ekspansi

  • 2 kutipan

menyimpan

DreamControl: Control-Based Text-to-3D Generation with 3D Self-Prior

    Tianyu HuangYihan Zeng +5 Penulis Wangmeng Zuo

ilmu Komputer Tldr

Ini mengoptimalkan adegan NeRF kasar sebagai preo mandiri 3D, dan kemudian menghasilkan objek berbutir halus untuk mengoptimalkan tekstur detail melalui distilasi skor berbasis kontrol menggunakan LoRA bersyarat dan skor tertimbang. memperluas

  • 2 kutipan

menyimpan

Inpaint4DNeRF: Promptable Spatio-Temporal NeRF Inpainting with Generative Diffusion Models

ilmu Komputer Tldr

Dalam makalah ini, kami mengusulkan Inpaint4DNeRF, yang memanfaatkan model difusi stabil yang canggih (misalnya, ControlNet) untuk secara langsung menghasilkan konten latar belakang yang lengkap, baik statis maupun dinamis. ekspansi

  • 1 kutipan

menyimpan

GaussianEditor: Swift and Controllable 3D Editing with Gaussian Splatting

    Yiwen ChenZilong Chen +7 penulis Guosheng Lin

ilmu Komputer Tldr

GaussianEditor adalah algoritma pengeditan 3D yang inovatif dan efisien berdasarkan Gaussian Splatting (GS). GS adalah representasi 3D baru yang meningkatkan presisi dan kontrol pengeditan melalui Gaussian Semantic Tracing yang diusulkan (menelusuri target pengeditan selama proses pembelajaran). ekspansi

  • 1 kutipan

menyimpan

IT3D: Improved Text-to-3D Generation with Explicit View Synthesis

    Yiwen ChenChi Zhang +4 Penulis Guo-Shing Lin

ilmu Komputer Tldr

Studi ini menawarkan strategi baru yang menggunakan gambar mult i-view yang disintesis secara eksplisit untuk menangani implikasi buku teks dari teks ke 3D, detail yang tidak memadai, dan masalah output yang tidak realistis. -Gan strategi pembelajaran ganda dan instrumen identifikasi. ekspansi

  • 1 kutipan

menyimpan

GeneAvatar: Generic Expression-Aware Volumetric Head Avatar Editing from a Single Image

    Chong Baoyinda Zhang +6 Penulis Zhaopeng Cui

ilmu Komputer Tldr

Dalam makalah ini, sebuah ekspresi baru yang mengusulkan pendekatan pengeditan avatar umu m-pos untuk berbagai avatar kepala volume 3DMM, dan memungkinkan pengeditan 2D lift dari satu gambar ke bidang modifikasi 3D yang konsisten. Memperbesar

menyimpan

Emo-Avatar: Efficient Monocular Video Style Avatar through Texture Rendering

    Pinxin Liuluchuan Song +5 Penulis Chenliang Xu

ilmu Komputer Tldr

Avatar gaya video monoton yang efisien dengan rendering saraf yang tertunda, yang meningkatkan kapasitas produksi video potret dinamis dan digerakkan StyleGan dan mengurangi waktu kustomisasi gaya dari beberapa jam menjadi 5 menit dibandingkan dengan metode yang ada. ekspansi

  • 1 kutipan

menyimpan

MorpheuS: Neural Dynamic 360 Surface Reconstruction from Monocular RGB-D Video

ilmu Komputer Tldr

Mpheus adalah kerangka kerja untuk rekonstruksi permukaan Dynamic 360 dari video RGB-D, yang secara santai difoto, dan diekstraksi pengetahuan darinya dengan memanfaatkan distribusi awal yang bergantung pada pandangan, dan mengekstraksi pengetahuan darinya. Ekspansi

  • 3 kutipan

menyimpan

64 References

Tipe yang dikutip File pdf Nama Penulis Filter lainnya Filter lainnya Menyaring

Pix2Video: Video Editing using Image Diffusion

ilmu Komputer Tldr

Demonstrasi bahwa dimungkinkan untuk mengedit panduan teks yang realistis dengan panduan teks yang realistis tanpa melakukan pr a-pemrosesan atau vide o-pr a-pemrosesan yang berbasis d i-fin e-fin e-fin e-fine, dan digeneralisasi untuk berbagai pengeditan. Memperbesar

  • 2 kutipan

menyimpan

GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models

    Alex Nicholprafulla Dhariwal +5 Penulis Mark Chen

ilmu Komputer Tldr

Dalam penelitian ini, kami mengeksplorasi model difusi untuk masalah sintesis gambar dengan kondisi teks dan membandingkan dua strategi panduan yang berbeda: panduan klip dan tidak ada classifier, perbandingan dua strategi panduan yang berbeda, yang terakhir, yang terakhir fotorisme dan keterangan. Ini lebih disukai oleh evaluator manusia di kedua kesamaan dan sering menghasilkan sampel pemasangan photolian. ekspansi

2. 506

  • 1 kutipan

menyimpan

DreamFusion: Text-to-3D using 2D Diffusion

ilmu Komputer Tldr

Dalam penelitian ini, kerugian berdasarkan distilasi kepadatan probabilitas yang memungkinkan penggunaan model difusi dua dimensi sebagai pr a-pembelajaran untuk mengoptimalkan generator gambar parametrik berdasarkan prosedur seperti Deepdream, dan telah dipelajari sebelumnya. Model difusi sebagai pr a-pembelajaran. Ekspansi

1. 491

  • 2 kutipan

menyimpan

Text2LIVE: Text-Driven Layered Image and Video Editing

ilmu Komputer Tldr

Ali h-alih menghasilkan output yang diedit secara langsung, id e-ide penting dibangun dengan membuat lapisan pengeditan (warna + opacity) yang disintesis pada input asli, dan langsung pada lapisan pengeditan. . ekspansi

  • 2 kutipan

menyimpan

Text-To-4D Dynamic Scene Generation

    Penulis Uriel Singershelly Sheeynin +8 Yaniv Taigman

ilmu Komputer Tldr

MAV3D (Make-A-Video3D) adalah metode untuk menghasilkan adegan dinamis tiga dimensi dari deskripsi teks, dan merupakan metode pertama menghasilkan adegan dinamis 3D dari deskripsi teks. Memperbesar

  • 1 kutipan

menyimpan

StyleNeRF: A Style-based 3D-Aware Generator for High-resolution Image Synthesis

ilmu Komputer Tldr

Stylenerf adalah model generasi pengenalan 3D untuk sintesis pencitraan resolusi tinggi, dan dapat dipelajari untuk gambar 2D yang belum lahir. Memperbesar

  • 1 kutipan

menyimpan

Dreamix: Video Diffusion Models are General Video Editors

    EYAL MOLADELIAHU HORWITZ +5 Penulis Yedid Hoshen

ilmu Komputer Tldr

Dalam penelitian ini, metode berbasis difusi primer pertama yang dapat mengedit dan mengedit penampilan dapat dilakukan untuk pertama kalinya, dan untuk tujuan baru yang tidak dapat disembuhkan yang menggunakan peringatan waktu yang lengkap dan wakt u-pencatatan. pengeditan. Ekspansi

  • 2 kutipan

menyimpan

Visual Object Networks: Image Generation with Disentangled 3D Representations

    Penulis Jun-Yan Zhuzhoutong Zhang +4 Bill Freeman

ilmu Komputer Tldr

Model Generasi Baru, Visual Object Networks (Vons), mensintesis gambar alami objek dengan ekspresi 3D terpisah, mengubah sudut pandang gambar yang dihasilkan, mengedit bentuk dan tekstur, linier dalam tekstur dan ruang bentuk. , seperti interpolasi, transfer berbagai objek dan penampilan di antara sudut pandang. ekspansi

  • 1 kutipan

menyimpan

High-Resolution Image Synthesis with Latent Diffusion Models

Ilmu Komputer, Teknik Tldr

Model difusi potensial ini tinggi dalam berbagai tugas termasuk pembuatan gambar tanpa syarat, sintesis dari teks, sintesis, teks, dan supe r-resolusi, dalam pencitraan dan sintesis gambar klasik. Memperbesar

9. 033

  • 1 kutipan

menyimpan

Structure and Content-Guided Video Synthesis with Diffusion Models

ilmu Komputer Tldr

Studi ini menyajikan model penyebaran video yang disebabkan oleh struktur dan konten yang mengedit video berdasarkan deskripsi output yang diinginkan, dan pelatihan pada estimasi kedalaman mata tunggal dengan berbagai tingkat detail. ekspansi

  • 2 kutipan